용어집

시계열 분석

시계열 분석의 강력한 기능을 활용하여 트렌드를 예측하고, 이상 징후를 감지하고, 산업 전반의 AI/ML 애플리케이션을 최적화하세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

시계열 분석은 시간에 따라 수집되거나 기록된 데이터 포인트의 시퀀스를 분석하는 데 사용되는 통계적 방법입니다. 주요 목표는 추세, 계절성, 주기 등 데이터 내의 기본 구조와 패턴을 이해하여 정보에 입각한 의사 결정이나 미래 예측을 내리는 것입니다. 이 기술은 과거 데이터를 활용하여 미래 가치를 예측하고 시간적 역학을 이해하는 다양한 분야에서 기본이 되는 기술입니다. 머신러닝(ML)의 전문 영역으로, 시간순으로 정렬된 데이터 포인트에 초점을 맞추며, 주로 시간별, 일별, 월별 등 일정한 간격으로 수집됩니다.

핵심 개념

시계열 데이터를 이해하려면 몇 가지 핵심 요소를 파악해야 합니다:

  • 추세: 데이터의 장기적인 증가 또는 감소입니다. 장기간에 걸친 시리즈의 일반적인 방향을 나타냅니다.
  • 계절성: 고정되고 알려진 기간(예: 일별, 주별, 연간) 동안 반복되는 패턴입니다. 예를 들어, 소매 판매는 종종 휴가철에 정점을 찍는 계절성을 보입니다. 계절 분해 기법은 이러한 패턴을 분리하는 데 도움이 됩니다.
  • 주기적 구성 요소: 고정된 기간이 아닌 장기적인 변동으로, 종종 더 광범위한 경제 또는 비즈니스 주기와 관련이 있습니다. 이러한 주기는 일반적으로 1년 이상의 장기간에 걸쳐 발생합니다.
  • 불규칙성(노이즈): 추세, 계절성 또는 주기적 구성 요소로 설명할 수 없는 데이터의 무작위적이고 예측할 수 없는 변동입니다.

효과적인 분석을 위해서는 데이터 전처리 기술이 필요한 경우가 많습니다. 여기에는 결측치 처리, 이동 평균과 같은 방법을 사용한 데이터 평활화, 잠재적으로 데이터를 변환하여 고정성을 달성하는 것이 포함됩니다. 평균과 분산과 같은 통계적 특성이 시간에 따라 일정하게 유지되는 고정성은 ARIMA(자동 회귀 통합 이동 평균)와 같은 기존 모델에서 일반적으로 요구되는 요건입니다. 이러한 맥락에서 Pandas와 같은 라이브러리는 데이터 조작에 필수적입니다.

기술 및 모델

시계열 분석에는 고전적인 통계 방법부터 최신 머신러닝 접근 방식에 이르기까지 다양한 기법과 모델이 사용됩니다:

  • 고전적인 방법: 이동 평균, 지수 평활화(ETS), ARIMA 모델을 포함합니다. 이러한 방법은 Python Statsmodels와 같은 통계 소프트웨어 라이브러리를 사용하여 구현하는 경우가 많습니다.
  • 머신 러닝 모델: 랜덤 포레스트XGBoost와 같은 기법을 시계열 예측에 적용할 수 있으며, 종종 지연된 피처를 생성하여 적용할 수 있습니다. Scikit-learn은 많은 ML 모델에 대한 구현을 제공합니다.
  • 딥러닝(DL) 모델: 복잡한 비선형 패턴의 경우, 딥러닝 아키텍처가 매우 효과적입니다. 여기에는 순환 신경망(RNN), 장단기 메모리(LSTM) 네트워크, 게이트 순환 유닛(GRU), 트랜스포머 모델 등이 있으며, 장거리 종속성을 포착하는 데 탁월합니다. 다음과 같은 프레임워크 PyTorchTensorFlow 와 같은 프레임워크가 이러한 DL 모델을 구축하는 데 일반적으로 사용됩니다. 일부 연구에서는 자연어 처리(NLP) 기술과의 교차점을 탐구하기도 합니다.

AI/ML의 실제 애플리케이션

시계열 분석은 예측 모델링과 이상 징후 탐지를 위한 많은 AI 및 ML 애플리케이션에서 매우 중요합니다:

  1. 금융 예측: 금융 분야의 AI에서는 시계열 모델이 과거 가격 변동과 거래량을 기반으로 주가, 환율, 시장 변동성을 예측합니다. 학계에서는 시장 예측을 위한 고급 모델을 계속 연구하고 있습니다.
  2. 에너지 부하 예측: 유틸리티 회사는 시계열 분석을 통해 전력 수요를 예측하여 전력 생산과 배전을 최적화합니다. 정확한 예측은 자원을 효율적으로 관리하고 재생 에너지의 지속 가능성 노력에 기여하는 데 도움이 됩니다. 미국 에너지 정보국(EIA) 과 같은 기관에서는 공공 에너지 예측을 제공합니다.
  3. 소매 판매 예측: 기업은 제품의 미래 판매를 예측하여 재고를 관리하고, 프로모션을 계획하고, 공급망을 최적화합니다. 과거 판매 데이터를 분석하면 소비자 수요를 예측하는 데 도움이 됩니다.
  4. 의료 모니터링: 시간 경과에 따라 기록된 환자의 생체 신호(예: 심박수, 혈압)를 분석하면 질병을 조기에 발견하고 환자를 모니터링하는 데 도움이 됩니다.

컴퓨터 비전 작업과의 차이점

시계열 분석은 시간에 따른 숫자 또는 범주형 데이터 포인트의 시퀀스에 초점을 맞추는 반면, 컴퓨터 비전(CV)은 이미지 또는 비디오의 시각적 정보를 해석하는 작업을 다룹니다. 객체 감지 또는 이미지 분할과 같은 작업은 종종 다음과 같은 모델에서 수행됩니다. Ultralytics YOLO11와 같은 모델이 주로 단일 프레임 내의 공간 콘텐츠를 분석하거나 프레임 간에 객체를 연관시키는 작업(객체 추적)을 수행합니다.

비디오 분석은 본질적으로 시간적 차원(프레임 시퀀스)을 포함하지만, 사용되는 기술은 기존의 시계열 방법과 다른 경우가 많습니다. 비디오 분석에서는 단변량 또는 다변량 시계열 데이터를 직접 분석하는 대신 공간적 특징과 시간에 따른 변화를 모두 고려하는 시공간 모델(예: 3D CNN 또는 비전 트랜스포머)을 사용할 수 있습니다. 일부 컴퓨터 비전 작업은 시계열 데이터를 생성할 수 있으며(예: 시간 경과에 따른 객체 수 추적), 표준 시계열 기법을 사용하여 분석할 수 있습니다.

도구 및 리소스

시계열 모델을 개발하고 배포하려면 다양한 도구가 필요합니다. ML 라이브러리 외에도 Meta의 Prophet 라이브러리와 같은 전문 도구는 사용자 친화적인 예측 기능을 제공합니다. 시계열 데이터 라이브러리에 있는 것과 같은 벤치마크 또는 사용자 지정 데이터 세트에 대한 학습부터 평가 및 배포에 이르기까지 이러한 모델의 수명 주기를 관리하는 데는 종종 기계 학습 운영(MLOps ) 원칙과 Ultralytics HUB와 같은 플랫폼이 포함됩니다. 학습 리소스의 경우, '예측: 원칙과 실습" 과 같은 텍스트는 포괄적인 지침을 제공하며, Kaggle과 같은 플랫폼에서는 실무 경험을 위한 시계열 경진대회를 개최합니다.

모두 보기
OSZAR »