| 단계 | 주요 내용 | 핵심 키워드 |
| 기초 (1~3강) | 예측의 기초를 다지고 데이터를 다듬는 법 | 델파이 방법, 계절변동, 로그변환, 주파수 분석, 백색잡음 |
| 도구 (4강) | 데이터 간의 관계를 파악하는 지표 | 자기상관(ACF), 부분자기상관(PACF), 안정성 |
| 모형 (5~6강) | 본격적인 예측 수식 만들기 | AR(나), MA(충격), ARIMA(차분 포함), GARCH(변동성) |
| 검정 (7강) | 만든 모형이 정말 쓸만한지 확인하기 | 단위근 검정, 이분산성 검정, AIC/BIC(모형 선택 기준) |
1강: 예측의 개요 학습 계획
- 예측의 정의와 필요성: 왜 우리는 미래를 맞춰야 하는가?
- 주관적 예측 vs 객관적 예측: 사람의 머리(직관) vs 컴퓨터의 계산(통계)
- 예측의 절차: 데이터를 모으고 모형을 만드는 6단계 과정
첫 번째 주제: 예측, 왜 하는 걸까요?
예측은 단순히 미래를 맞히는 게임이 아니라, **'합리적인 의사결정'**을 하기 위해서입니다.
- 정책 시차: 정부가 오늘 정책을 세워도 효과는 몇 달 뒤에 나타나죠? 그래서 미래를 미리 예측하고 정책을 짜야 합니다.
- 예측오차: 예측은 100% 맞을 수 없습니다. 그래서 우리는 "얼마나 틀렸나?"를 계산해서(예측오차) 계속 모형을 수정해 나갑니다.
두 번째 주제: 두 가지 예측 방법 (주관적 vs 객관적)
강의록에서는 예측 방법을 크게 두 갈래로 나눕니다.
- 주관적 예측 (정성적 예측):
- 특징: 데이터가 부족하거나, 과거와 완전히 다른 미래를 예측할 때 전문가의 직관을 사용합니다.
- 델파이 방법 (Delphi Method): 전문가들에게 설문을 돌리고, 그 결과를 다시 공유해서 의견을 하나로 모으는 방식입니다. (중요!)
- 시나리오법: 미래에 일어날 수 있는 여러 상황(Best, Worst 등)을 미리 그려보는 방식입니다.
- 객관적 예측 (정량적 예측):
- 특징: 과거 데이터를 바탕으로 통계 수식을 써서 예측합니다. (우리가 4~6강에서 배운 내용들이죠!)
- 인과모형: "A 때문에 B가 변한다"는 원인을 분석 (예: 회귀분석)
- 시계열모형: "과거의 패턴이 미래에도 이어진다"고 가정 (예: ARIMA)
세 번째 주제: 예측은 어떻게 진행되나요? (6단계)
교수님이 강조하시는 예측의 표준 절차입니다. 흐름만 이해하면 돼요.
- 문제 정의: 무엇을, 언제까지 예측할 것인가?
- 정보 수집: 관련 데이터를 모으기
- 예비 분석: 데이터를 그래프로 그려보기 (2강에서 배운 시계열 도표!)
- 모형 선택: 어떤 수식을 쓸지 결정 (4, 5강의 ACF/PACF 활용)
- 예측모형 작성 및 평가: 실제 예측값을 뽑고 얼마나 잘 맞는지 검토
- 예측 수행: 실제 의사결정에 활용하기
💡 1강 마무리 퀴즈 (전체 복습)
1강에서 가장 중요한 개념 중 하나인 **'델파이 방법(Delphi Method)'**에 대한 문제입니다.
"전문가들의 독립적인 의견을 수집하고, 이를 요약하여 다시 전문가들에게 피드백하는 과정을 반복함으로써 합의된 예측치를 도출하는 방법은 무엇일까요?"
- 시계열 분석법
- 델파이 방법
- 회귀 분석법
전문가들의 의견을 모으고 다듬어서 하나의 결론으로 향해가는 과정, 그것이 바로 델파이 방법의 핵심입니다.
2강: 예측 데이터(시계열) 학습 계획
- 시계열의 변동요인: 데이터가 왜 오르락내리락하는지 4가지 이유 찾기
- 변수변환: 분석하기 좋게 데이터를 예쁘게 다듬는 법 (로그, 박스-콕스)
- 차분과 평활화: 복잡한 노이즈를 걷어내고 알맹이(추세)만 보기
첫 번째 주제: 시계열의 4가지 변동요인
시계열 데이터($Y_t$)는 보통 다음 4가지 요소가 섞여서 만들어집니다.
- 추세변동(Trend, $T_t$): 장기적으로 위로 가나, 아래로 가나? (예: 인구 감소, 경제 성장)
- 계절변동(Seasonal, $S_t$): 1년 단위로 반복되는 패턴 (예: 여름엔 에어컨, 겨울엔 패딩)
- 순환변동(Cyclic, $C_t$): 1년보다 긴 주기로 오르내리는 경기 파동
- 불규칙변동(Irregular, $I_t$): 천재지변처럼 아무 이유 없이 튀는 값 (오차)
비유: 주가($Y_t$)는 우상향하는 기업의 가치(추세) + 명절 특수(계절) + 경기 불황(순환) + 갑작스러운 전쟁 뉴스(불규칙)가 합쳐진 결과물인 셈이죠!
두 번째 주제: 변수변환 (데이터 성형하기)
데이터가 너무 들쭉날쭉하면 분석이 안 돼요. 그래서 도구를 씁니다.
- 로그(Log) 변환: 뒤로 갈수록 진동 폭이 커지는 데이터를 일정하게 눌러줍니다.
- 박스-콕스(Box-Cox) 변환: 로그 변환을 포함해서, 데이터를 가장 '정규분포'스럽게 만들어주는 마법의 공식이에요.
세 번째 주제: 차분과 평활화 (노이즈 제거)
- 차분(Difference): 아까 6강에서도 나왔죠? "오늘 - 어제"를 해서 '추세'를 지우고 데이터의 높낮이만 보는 거예요.
- 평활화(Smoothing): 이동평균(MA) 등을 써서 뾰족뾰족한 그래프를 부드러운 곡선으로 만드는 거예요. 추세를 파악하기 훨씬 쉬워지죠.
💡 이해도 체크 퀴즈! (2강)
"아이스크림 판매량 데이터를 분석하는데, 매년 여름마다 판매량이 급증하는 패턴이 발견되었습니다. 이 현상은 4가지 변동요인 중 무엇에 해당할까요?"
- 추세변동 (Trend)
- 계절변동 (Seasonal)
- 불규칙변동 (Irregular)
매년 돌아오는 여름은 주기적인 **'계절변동'**의 대표적인 사례죠.
3강: 주파수 분석과 확률과정 학습 계획
- 주파수 분석(Frequency Analysis): 시계열을 사인(sine)과 코사인(cosine) 함수로 분해하기
- 주기도와 스펙트럼: 어떤 주기가 가장 강한지 파악하는 도구
- 확률과정(Stochastic Process): 시계열 데이터를 수학적 모델로 정의하기
첫 번째 주제: 주파수 분석 (푸리에 변환)
우리는 보통 시계열을 '시간(Time Domain)' 축에서 봅니다. 하지만 3강에서는 이걸 '주파수(Frequency Domain)' 축으로 옮겨서 봅니다.
- 비유: 우리가 듣는 음악은 여러 악기의 소리가 합쳐진 것이죠? **'푸리에 변환'**은 이 복잡한 음악에서 "드럼은 이만큼, 피아노는 이만큼 들어있어"라고 악기별(주파수별)로 분리해 내는 작업과 같습니다.
- 삼각함수의 활용: 시계열을 $sin$과 $cos$ 같은 파동 함수의 합으로 표현합니다. 주기가 짧으면 주파수가 높고, 주기가 길면 주파수가 낮다고 말하죠.

두 번째 주제: 주기도(Periodogram)와 스펙트럼
주파수 분석을 해서 나온 결과물을 그래프로 그린 것이 주기도와 스펙트럼입니다.
- 주기도(Periodogram): 시계열 데이터에서 어떤 특정 주기($f$)가 얼마나 강력하게 나타나는지를 보여줍니다.
- 해석: 만약 주기도 그래프에서 '주기 12'인 지점이 툭 튀어나와 있다면, 그 데이터는 **12개월 주기(계절성)**를 아주 강하게 가지고 있다는 뜻이에요.
세 번째 주제: 확률과정(Stochastic Process)의 기초
이제 데이터를 조금 더 학술적으로 정의해 볼게요. 시계열은 **'확률과정'**이 현실로 나타난 결과물입니다.
- 앙상블(Ensemble): 이론적으로 존재할 수 있는 모든 가능한 시계열의 모임입니다. 우리가 관측한 데이터는 그중 딱 하나가 실현된 것이죠.
- 백색잡음(White Noise): 시계열 모형에서 가장 중요한 '오차'의 정체입니다. 평균이 0이고, 과거와 현재가 아무런 상관이 없는 순수한 무작위 상태를 말합니다.
💡 이해도 체크 퀴즈! (3강)
어떤 회사의 매출 데이터를 주파수 분석했더니, **주기가 4인 지점에서 아주 높은 피크(Peak)**가 관찰되었습니다. (이 데이터는 분기별로 수집된 데이터라고 가정합니다.) 이 결과는 무엇을 의미할까요?
- 이 회사의 매출은 매달 랜덤하게 변한다.
- 이 회사는 매년 4분기(1년 주기)마다 매출이 반복되는 뚜렷한 계절성을 가지고 있다.
- 이 회사의 매출은 아무런 주기성 없이 계속 하락하고 있다.
'Data Science > Statistics' 카테고리의 다른 글
| [예측방법론] 모형 (5~6강) 시계열모형 (0) | 2026.04.10 |
|---|---|
| [예측방법론] 도구 (4강) 시계열의 자기상관 (0) | 2026.04.10 |
| [통계학개념] 심슨의 역설 (0) | 2024.03.15 |
| 회귀 모델 평가 지표, 결정 계수 R² (0) | 2023.06.25 |