시계열 | 이동 평균(Moving Average) 기초딥상어동의 딥한 데이터 처리/전처리2021. 5. 2. 23:16
Table of Contents
왜 사용하는가?
왜냐하면, 장기적인 트렌드를 보기 위해서이다.
위 그림을 한번 살펴보자. 파란색 라인에 비해 주황색 라인이 좀 더 완만하지 않은가?
하지만, 두 라인을 그린 데이터 원본은 동일하다.
파란색 -> 주황색과 같이 라인을 완만하게 만드는 작업을 Smoothing이라고 한다. 그리고, 그 Smoothing을 하는 방법 중 하나가 이동 평균선이다. (Moving Average)
왜 완만하게(Smoothing) 만드는가?
가장 기본적인 사고의 발상은 날 것 그대로의 데이터에 Noise가 끼어있을 수 있다는 것이다.
예를 들어, 철수가 다음과 같이 물건을 팔았다고 생각해보자.
05/01 100개
05/02 1000개
05/03 200개
5월 2일, 철수한테는 무슨 일이 있었을까? 큰 손이라도 나타난 것일까? 어쨌든, 이건 주요 관심사가 아니다. 중요한 건 5월 2일에 나타난 큰 손의 철수의 "판매량 추이"를 살펴보는걸 방해했다는 것이다.
그래서, 단순히 날 것 그대로의 데이터로 표현하는게 아니라 (100 + 1000 + 200)/3 과 같이 특정 기간 동안의 평균으로 데이터를 나타내기도 한다. 이렇게 하는 과정에서 noise가 줄어드는 것이다. 즉, noise를 최소화하면서 추이를 관찰하기 위해 Smoothing을 한다고 할 수 있다.
'딥상어동의 딥한 데이터 처리 > 전처리' 카테고리의 다른 글
[Pandas] 이것만은 알고가자 - 1.Indexing(iloc, loc) (0) | 2021.06.05 |
---|---|
[Pandas] 이것만은 알고가자 - 0.파일 불러오기 (0) | 2021.06.05 |
Pandas | Melt (0) | 2021.03.02 |
Pandas | Stack VS Unstack (2) | 2021.01.28 |
PYTHON | JSON 파일 DataFrame 변환(json_normalize) (5) | 2020.12.06 |
@딥상어동의 딥한생각 :: 딥상어동의 딥한생각
제 블로그에 와주셔서 감사합니다! 다들 오늘 하루도 좋은 일 있으시길~~
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!