인공지능

시계열 분석 프로그램

귀요미찰쓰 2021. 10. 25. 15:56
728x90
반응형

고등학교 동아리 겨울방학 프로젝트로 제출하였던 프로그램을 적어보겠습니다.

반응형

이 프로젝트는 시계열 분석을 이용해서 아보카도 물가 예측하는 프로그램을 만들어봤는데요.

 

일단 시계열 분석이란?

일정한 시간 간격으로 표시된 자료의 특성을 파악하여 미래를 예측하는 분석방법입니다.

 

제가 이용한 환경

IDE: 구글 colab

사용한 라이브러리

- Pandas

- fbprophet

- matplotlib

필요한 데이터 셋:

-2018 아보카도 가격 데이터 셋

-2020 아보카도 가격 데이터 셋

 

프로젝트 구현 방식

1. 그리고 2018 아보카도 가격 데이터셋을 활용하여 2018 아보카도 가격 데이터 셋을 다운 받는다.

2. 2018 아보카도 가격 데이터셋의 분포도와 대략적인 개요를 파악을해준다.

3. 저 데이터셋에서 원하는 데이터를 가져온다.

4. 그 데이터셋의 시각화를 함으로써 2018년도까지 어떻게 물가가 이루어져있는지 확인

5. 그리고 Prophet을 통해서 학습을 시켜준다.

6. 학습한 내용을 확인하기 위해 시각화를 시켜준다.

7. 마지막으로 예측한 결과가 얼마나 정확한지를 확인하기 위해서 그전에 데이터셋을 받은 것을 활용하여 필요한 부분만 표로 추출시킨다.

8. 그리고 그 내용을 시각화를 해주고 얼마나 다른지 서로 비교를해준다.

 

제가 사용할 모듈들을 import해준다음

kaggle.com에서 다운로드 받은 데이터셋을 업로드해준다.

df = pd.read_csv를 이용하여 csv 파일을 읽고 데이터 프레임의 첫 5줄을 출력한다.

groupby를 통해서 conventional type과 organic type에 관해서만 분석을한다.

데이터 원하는 부분을 추출

plot 기능을 이용하여 시각화를 시킨다.

Prophet을 통해 학습

학습한 데이터를 표로 확인

위에 plot을 통해서 시각화를 시켜준 것

 

ㅁㅇㄹ

이 그래프를 보면 점이 있는 부분이랑 점이 없는 부분이 있는데 점이 있는 부분은 실질적으로 데이터가 있는 부분이고 점이 없는 부분들은 예측한 부분이다.

 

이 그래프는 2020 데이터를 시각화를 한 것이다.

두 그래프를 비교하면 예측하면 2019년도부터 2020년까지 비슷한걸 알 수 있다.

반응형