시계열 데이터 분석 : 과거에는 발생하지 않았던 이상치를 탐지한다

모델링 과정

ARIMA : 통계추론 알고리즘 -> 파라미터 기반 예측

Prophet : 페이스북이 만든 알고리즘 / 이론적 방정식에 완전히 맡기는게 아니라 세부적인 것들은 분석가에 맡겨 판단한다 

LSTM : 

AutoEncoder : 

나머지 2개는 neural network , 특정 파라미터를 생성하지 않고, 하이퍼 파라미터 최적화가 필요하다

 

프로젝트 목표

- 장애 및 고장을 사전에 예측 -> 딥러닝 모델을 이용하여 시계열 데이터의 이상징후 탐지

데이터 소개

- MME 장비의 성능 상태를 파악할 수 있는 통계 데이터

시도 와 성공률

SRC_NM : 총 9개 장비로 측정

데이터의 결측치가 존재

missingno패키지를 활용하면 직관적으로 결측치(하얀색) 확인 가능



시간과 장비에 따른 데이터 정리

variable : 시도 와 성공률 

src_nm : 총 9개의 기기

-> pivot table을 통해 한 시간대에 돌아간 기기들을 묶음 


시계열 데이터

- 시계열 데이터의 특성 및 구성 요소에 대해 이해합니다

- 시계열 모형과 통계적 시계열 분석을 위한 변환 필요성을 이해

- 정상성 검증

정상성 이란? 특별하게 튀는 값 없도록, 범위를 한정짓는다


 

3주 목표 start

파이썬정복
|2024. 7. 27. 14:34

11일 경연 마감날