기상 데이터와 비기상 데이터를 활용하여 단위 면적 당 양파 생산량을 예측하는 모형을 개발하는 것이 목적이다.
분석에 사용할 데이터 |
|
기상 데이터(ASOS) |
비기상 데이터 |
1. (ASOS) 일조시간 2. (AWS) 기온, 강수량 3. (파생변수) 월 평균, 최대, 최소, 합계 기상 요소, 일교차 |
1. 양파 생산량 2. 양파 재배 면적 3. 양파 재배 비율 |
Analytics |
|
양파 생산량 영향 변수 선택 |
|
정의 |
회귀계수가 높은 기준으로 상관계수가 일정 이상인 변수를 선택. |
분석방법 |
일반 선형 모델(GLM: Generalized Linear Model), 피어슨 상관분석(Pearson's Correlation) |
분석 결과 |
양파 생산량 영향 변수 선택 |
양파 생산량 산출 모형 구축 |
|
정의 |
일반 선형 모델(GLM)을 활용하여 단위 면적 당 양파 생산량을 산출하는 산출식 도출 |
분석방법 |
일반 선형 모델(GLM: Generalized Linear Model) |
분석 결과 |
양파 생산량 산출 모형 |
분석절차 |
||
단위 면적 당 양파 생산량 예측 모형 구축 절차 |
||
|
실습 설명 |
실습 단계 |
1. 데이터 로딩 |
분석환경을 설정하고 분석에 필요한 기상데이터 및 비기상데이터를 로딩하여 분석에 필욯나 데이터를 준비하는 단계 |
1. 분석 환경 설정 및 패키지 로딩 2. 데이터 불러오기 3. 데이터 결합하기 |
2. 데이터 탐색 |
분석 데이터의 데이터 타입을 변환하고 탐색적 자료 분석(Exploratory Data Analysis)을 수행하는 단계 |
1. 타입 변환 2. 탐색적 자료분석 |
3. 데이터 처리 |
이상치와 결측치를 대체하며 파생변수를 생성하여 최종 분석 데이터셋을 완성하는 단계 |
1. 이상치 및 결측치 대체 2. 파생변수 생성 3. 분석 데이터셋 완성 |
4. 모형 구축 |
데이터간의 다중공선성을 제거하여 단위면적 당 양파 생산량 영향 변수를 선택하는 단계 |
1. 다중공선성 해결 및 변수 선택 2. 모형 구축 |
5. 모형 검증 |
최종 구축한 산출 모형의 성능을 검증하는 단계 |
1. 교차 검증 |
ref.
날씨마루
https://bd.kma.go.kr/kma2017/dta/edu/KBP57000.do?menuCd=F0403
'데이터 분석 > 데이터 분석 프로젝트' 카테고리의 다른 글
[MTG 프로젝트] MTG Goldfish에서 현재 스탠다드 메타 덱 카드 자료를 수집하고 정량적으로 분석하기 - 1 (데이터 수집단계) (1) | 2018.07.08 |
---|---|
[Python Scraping] 스크래핑(크롤링)을 이용하여 위키 문헌에 있는 윤동주 작가의 작품 목록 가져오기 (0) | 2018.07.02 |
[설문조사 분석] Python으로 분석한 Kaggle 2017 Survey -5 (0) | 2018.06.28 |
[설문조사 분석] Python으로 분석한 Kaggle 2017 Survey -4 (0) | 2018.06.27 |
[설문조사 분석] Python으로 분석한 Kaggle 2017 Survey -3 (1) | 2018.06.25 |