- 웹 어플리케이션 바로가기
- 깃 허브 레포지토리 바로가기
- 프로젝트 포스팅 목록
CSV 변환
- 이 전에 PostgreSQL로 저장한 데이터를 머신 러닝 모델링을 위해 CSV 파일로 변환한다.
1 |
|
LightGBM 회귀 모델링
1 |
|
- PostgreSQL에서 CSV로 변환할 시 컬럼명이 지정되어 있지 않으므로 헤더를 지정한다.
- 모든 컬럼을 사용하고 싶지만, 예측에는 예보 기상이 활용되어야 하기 때문에 예보에서 확인할 수 있는 컬럼으로만 모델링을 진행한다.
- avgRhm: 습도
- ddMes: 적설량
- sumSsHr: 일조시간
- avgPs: 해면기압
- avgTca: 전운량
- minTa: 최저기온
- maxTa: 최고기온
- avgWs: 풍속
- sumRn: 강수량
- avgTa: 평균기온
- avgTd: 평균 이슬점온도
1 |
|
1 |
|
1 |
|
- 사실 모든 컬럼을 사용했을 때보다 평가 점수는 만족할 수 없지만, 0.5가 넘으므로 이 모델 사용 예정이다.
- 날씨와 코로나의 상관관계가 적고 데이터 또한 적기 때문에 과적합의 위험이 굉장히 크다.
- 여러모로 마음에 들진 않지만, 웹 구현이 목적이므로 그대로 진행한다.
1 |
|
- LightGBM을 처음 사용했는데 별 설정을 안해줘도 엄청난 학습 능력을 자랑하는 것 같다.
SHAP
- 대략적인 특성 중요도를 확인해본다.
1 |
|
피클(Pickle)
- 플라스크에서 사용하기 위해
joblib
을 이용하여 모델을 피클 형태로 저장한다.
1 |
|