본문 바로가기
Data Science/Statistics

[예측방법론] 기초 (1~3강) 예측의 개요, 예측데이터:시계열, 주파수분석과 확률과정

by 에르모사 쩐뉴 2026. 4. 10.
단계 주요 내용 핵심 키워드
기초 (1~3강) 예측의 기초를 다지고 데이터를 다듬는 법 델파이 방법, 계절변동, 로그변환, 주파수 분석, 백색잡음
도구 (4강) 데이터 간의 관계를 파악하는 지표 자기상관(ACF), 부분자기상관(PACF), 안정성
모형 (5~6강) 본격적인 예측 수식 만들기 AR(나), MA(충격), ARIMA(차분 포함), GARCH(변동성)
검정 (7강) 만든 모형이 정말 쓸만한지 확인하기 단위근 검정, 이분산성 검정, AIC/BIC(모형 선택 기준)

 

 

1강: 예측의 개요 학습 계획

  1. 예측의 정의와 필요성: 왜 우리는 미래를 맞춰야 하는가?
  2. 주관적 예측 vs 객관적 예측: 사람의 머리(직관) vs 컴퓨터의 계산(통계)
  3. 예측의 절차: 데이터를 모으고 모형을 만드는 6단계 과정

 첫 번째 주제: 예측, 왜 하는 걸까요?

예측은 단순히 미래를 맞히는 게임이 아니라, **'합리적인 의사결정'**을 하기 위해서입니다.

  • 정책 시차: 정부가 오늘 정책을 세워도 효과는 몇 달 뒤에 나타나죠? 그래서 미래를 미리 예측하고 정책을 짜야 합니다.
  • 예측오차: 예측은 100% 맞을 수 없습니다. 그래서 우리는 "얼마나 틀렸나?"를 계산해서(예측오차) 계속 모형을 수정해 나갑니다.

 두 번째 주제: 두 가지 예측 방법 (주관적 vs 객관적)

강의록에서는 예측 방법을 크게 두 갈래로 나눕니다.

  1. 주관적 예측 (정성적 예측):
    • 특징: 데이터가 부족하거나, 과거와 완전히 다른 미래를 예측할 때 전문가의 직관을 사용합니다.
    • 델파이 방법 (Delphi Method): 전문가들에게 설문을 돌리고, 그 결과를 다시 공유해서 의견을 하나로 모으는 방식입니다. (중요!)
    • 시나리오법: 미래에 일어날 수 있는 여러 상황(Best, Worst 등)을 미리 그려보는 방식입니다.
  2. 객관적 예측 (정량적 예측):
    • 특징: 과거 데이터를 바탕으로 통계 수식을 써서 예측합니다. (우리가 4~6강에서 배운 내용들이죠!)
    • 인과모형: "A 때문에 B가 변한다"는 원인을 분석 (예: 회귀분석)
    • 시계열모형: "과거의 패턴이 미래에도 이어진다"고 가정 (예: ARIMA)

 세 번째 주제: 예측은 어떻게 진행되나요? (6단계)

교수님이 강조하시는 예측의 표준 절차입니다. 흐름만 이해하면 돼요.

  1. 문제 정의: 무엇을, 언제까지 예측할 것인가?
  2. 정보 수집: 관련 데이터를 모으기
  3. 예비 분석: 데이터를 그래프로 그려보기 (2강에서 배운 시계열 도표!)
  4. 모형 선택: 어떤 수식을 쓸지 결정 (4, 5강의 ACF/PACF 활용)
  5. 예측모형 작성 및 평가: 실제 예측값을 뽑고 얼마나 잘 맞는지 검토
  6. 예측 수행: 실제 의사결정에 활용하기

💡 1강 마무리 퀴즈 (전체 복습)

1강에서 가장 중요한 개념 중 하나인 **'델파이 방법(Delphi Method)'**에 대한 문제입니다.

"전문가들의 독립적인 의견을 수집하고, 이를 요약하여 다시 전문가들에게 피드백하는 과정을 반복함으로써 합의된 예측치를 도출하는 방법은 무엇일까요?"

  1. 시계열 분석법
  2. 델파이 방법
  3. 회귀 분석법

전문가들의 의견을 모으고 다듬어서 하나의 결론으로 향해가는 과정, 그것이 바로 델파이 방법의 핵심입니다.

2강: 예측 데이터(시계열) 학습 계획

  1. 시계열의 변동요인: 데이터가 왜 오르락내리락하는지 4가지 이유 찾기
  2. 변수변환: 분석하기 좋게 데이터를 예쁘게 다듬는 법 (로그, 박스-콕스)
  3. 차분과 평활화: 복잡한 노이즈를 걷어내고 알맹이(추세)만 보기

 첫 번째 주제: 시계열의 4가지 변동요인

시계열 데이터($Y_t$)는 보통 다음 4가지 요소가 섞여서 만들어집니다.

  • 추세변동(Trend, $T_t$): 장기적으로 위로 가나, 아래로 가나? (예: 인구 감소, 경제 성장)
  • 계절변동(Seasonal, $S_t$): 1년 단위로 반복되는 패턴 (예: 여름엔 에어컨, 겨울엔 패딩)
  • 순환변동(Cyclic, $C_t$): 1년보다 긴 주기로 오르내리는 경기 파동
  • 불규칙변동(Irregular, $I_t$): 천재지변처럼 아무 이유 없이 튀는 값 (오차)

비유: 주가($Y_t$)는 우상향하는 기업의 가치(추세) + 명절 특수(계절) + 경기 불황(순환) + 갑작스러운 전쟁 뉴스(불규칙)가 합쳐진 결과물인 셈이죠!


 두 번째 주제: 변수변환 (데이터 성형하기)

데이터가 너무 들쭉날쭉하면 분석이 안 돼요. 그래서 도구를 씁니다.

  • 로그(Log) 변환: 뒤로 갈수록 진동 폭이 커지는 데이터를 일정하게 눌러줍니다.
  • 박스-콕스(Box-Cox) 변환: 로그 변환을 포함해서, 데이터를 가장 '정규분포'스럽게 만들어주는 마법의 공식이에요.

 세 번째 주제: 차분과 평활화 (노이즈 제거)

  • 차분(Difference): 아까 6강에서도 나왔죠? "오늘 - 어제"를 해서 '추세'를 지우고 데이터의 높낮이만 보는 거예요.
  • 평활화(Smoothing): 이동평균(MA) 등을 써서 뾰족뾰족한 그래프를 부드러운 곡선으로 만드는 거예요. 추세를 파악하기 훨씬 쉬워지죠.

💡 이해도 체크 퀴즈! (2강)

"아이스크림 판매량 데이터를 분석하는데, 매년 여름마다 판매량이 급증하는 패턴이 발견되었습니다. 이 현상은 4가지 변동요인 중 무엇에 해당할까요?"

  1. 추세변동 (Trend)
  2. 계절변동 (Seasonal)
  3. 불규칙변동 (Irregular)

매년 돌아오는 여름은 주기적인 **'계절변동'**의 대표적인 사례죠.

 

 3강: 주파수 분석과 확률과정 학습 계획

  1. 주파수 분석(Frequency Analysis): 시계열을 사인(sine)과 코사인(cosine) 함수로 분해하기
  2. 주기도와 스펙트럼: 어떤 주기가 가장 강한지 파악하는 도구
  3. 확률과정(Stochastic Process): 시계열 데이터를 수학적 모델로 정의하기

 첫 번째 주제: 주파수 분석 (푸리에 변환)

우리는 보통 시계열을 '시간(Time Domain)' 축에서 봅니다. 하지만 3강에서는 이걸 '주파수(Frequency Domain)' 축으로 옮겨서 봅니다.

  • 비유: 우리가 듣는 음악은 여러 악기의 소리가 합쳐진 것이죠? **'푸리에 변환'**은 이 복잡한 음악에서 "드럼은 이만큼, 피아노는 이만큼 들어있어"라고 악기별(주파수별)로 분리해 내는 작업과 같습니다.
  • 삼각함수의 활용: 시계열을 $sin$$cos$ 같은 파동 함수의 합으로 표현합니다. 주기가 짧으면 주파수가 높고, 주기가 길면 주파수가 낮다고 말하죠.


 두 번째 주제: 주기도(Periodogram)와 스펙트럼

주파수 분석을 해서 나온 결과물을 그래프로 그린 것이 주기도스펙트럼입니다.

  • 주기도(Periodogram): 시계열 데이터에서 어떤 특정 주기($f$)가 얼마나 강력하게 나타나는지를 보여줍니다.
  • 해석: 만약 주기도 그래프에서 '주기 12'인 지점이 툭 튀어나와 있다면, 그 데이터는 **12개월 주기(계절성)**를 아주 강하게 가지고 있다는 뜻이에요.

 세 번째 주제: 확률과정(Stochastic Process)의 기초

이제 데이터를 조금 더 학술적으로 정의해 볼게요. 시계열은 **'확률과정'**이 현실로 나타난 결과물입니다.

  • 앙상블(Ensemble): 이론적으로 존재할 수 있는 모든 가능한 시계열의 모임입니다. 우리가 관측한 데이터는 그중 딱 하나가 실현된 것이죠.
  • 백색잡음(White Noise): 시계열 모형에서 가장 중요한 '오차'의 정체입니다. 평균이 0이고, 과거와 현재가 아무런 상관이 없는 순수한 무작위 상태를 말합니다.

💡 이해도 체크 퀴즈! (3강)

어떤 회사의 매출 데이터를 주파수 분석했더니, **주기가 4인 지점에서 아주 높은 피크(Peak)**가 관찰되었습니다. (이 데이터는 분기별로 수집된 데이터라고 가정합니다.) 이 결과는 무엇을 의미할까요?

  1. 이 회사의 매출은 매달 랜덤하게 변한다.
  2. 이 회사는 매년 4분기(1년 주기)마다 매출이 반복되는 뚜렷한 계절성을 가지고 있다.
  3. 이 회사의 매출은 아무런 주기성 없이 계속 하락하고 있다.