본문 바로가기
카테고리 없음

시계열 분해란? (Time Series Decomposiotion)

by xangmin 2022. 5. 12.
반응형

시계열 데이터란?

시간에 순차적으로 관측한 값들의 집합이며, 예측 모델에서 시간을 변수로 사용하는 특징이 있다.

 

시계열 데이터 분석이란?

과거 데이터의 패턴을 분석하여 미래의 값을 예측하는 방법으로, 과거의 패턴이 미래에도 지속된다는 데이터의 안정성이 기본적인 가정으로 필요하다.

 

시계열 분해법이란? What is Time Series Decomposition?

시계열 데이터를 추세/순환/계절/불규칙 요소로 분해하는 기법이다.

 

추세(Trend)란?

데이터가 장기적으로 증가하거나 감소하는 것이며, 추세가 꼭 선형적일 필요는 없다.

 

순환(Cycle)이란?

경기변동과 같이 정치, 경제, 사회적 요인에 의한 변화로, 일정 주기가 없으며 장기적인 변화 현상이다.

 

계절성(Seasonal)이란?

주, 월, 분기, 반기 단위 등 특정 시간의 주기로 나타나는 패턴이다.

 

불규칙요소(Random, Residual)란?

설명될 수 없는 요인 또는 돌발적인 요인에 의하여 일어나는 변화로, 예측 불가능한 임의의 변동을 의미한다. 분해법에서는 원래 데이터의 추세, 순환, 계절성을 뺀 나머지를 불규칙 요소라고 한다.

 

즉, 시계열 데이터는 추세, 순환, 계절성, 불규칙 요소로 이루어져 있으며 이를 식으로 나타내면 다음과 같다.

 

1. 덧셈 분해(additive decomposition)

 여기서  yt는 데이터이고, t는 시점, St는 계절 성분, Tt는 추세 및 순환 성분, Rt는 불규칙 요소를 의미한다. 

 

2. 곱셈 분해(multiplicative decomposition)

 덧셈 대신 곱셈으로 분해하는 경우도 존재한다. 이 때, 식은 다음과 같다.

단, multiplicative 모델을 활용하려면 데이터에 0이 존재해서는 안된다.

 

덧셈 분해와 곱셈 분해의 차이점은 덧셈 분해는 Trend와 Seasonal이 별개고, 곱셈 분해는 Trend에 따라 Seasonal이 변화한다고 보면 된다.

 

위 그림에 첫 번째 예시는 시간이 지남에 따라 (Trend가 변화함에 따라) 변동 폭이 일정하지만, 두 번째 예시는 Trend가 상승함에 따라 변동폭 역시 증가하고 있다. 즉, 첫 번째 예시는 Additive가 적절하고, 두 번째 예시는 Multiplicative가 적절하다.

 

Raw 데이터를 각각의 패턴으로 해석하는 예시는 다음과 같다.

 미국 단독 주택 거래량 같은 경우, 전체 기간에 걸쳐 분명한 추세가 있지 않지만, 매년 강한 계절성과 약 6~10년 주기의 패턴이 존재한다.

 미국 재무부 단기 증권 계약의 경우, 점진적으로 하향하는 추세가 보인다.

 호주분기별 전력 생산의 겅우, 강한 계절성과 증가 추세가 보인다.

 구글 주식 종가 기준 일별 변동은 추세, 계절성 및 주기적인 패턴이 보이지 않는다.

 

이러한 패턴에 따라 분석 기법이 달라지기 때문에, 알고리즘에 fitting 하기에 앞서 EDA과정을 거쳐 데이터의 특성을 파악해야 한다.

 

참고 및 출처 :

https://otexts.com/fppkr/index.html

 

Forecasting: Principles and Practice

2nd edition

otexts.com

https://leedakyeong.tistory.com/entry/%EC%8B%9C%EA%B3%84%EC%97%B4-%EB%B6%84%ED%95%B4%EB%9E%80Time-Series-Decomposition-%EC%8B%9C%EA%B3%84%EC%97%B4-%EB%B6%84%EC%84%9D%EC%9D%B4%EB%9E%80-%EC%8B%9C%EA%B3%84%EC%97%B4-%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%9E%80-%EC%B6%94%EC%84%B8Trend-%EC%88%9C%ED%99%98Cycle-%EA%B3%84%EC%A0%88%EC%84%B1Seasonal-%EB%B6%88%EA%B7%9C%EC%B9%99-%EC%9A%94%EC%86%8CRandom-Residual

 

시계열 분해란?(Time Series Decomposition) :: 시계열 분석이란? 시계열 데이터란? 추세(Trend), 순환(Cycle),

시계열 데이터란? 시간에 순차적으로 관측한 값들의 집합이며, 예측 모델에서 시간을 변수로 사용하는 특징이 있다. 시계열 데이터 분석이란? 과거 데이터의 패턴을 분석하여 미래의 값을 예측

leedakyeong.tistory.com

 

 

 

 

 

 

 

 

 

 

 

 

 

반응형

댓글