AI,머신러닝/AI,ML 연습 3

(dacon) 농산물 가격 예측 (시계열 분석)

dacon 농산물 가격 예측 튜토리얼 https://dacon.io/edu/21025 농산물 가격 예측 프로젝트 농산물 가격 예측 프로젝트 학습을 통해 시계열 데이터 분석를 분석하는 기본적인 기법에서 부터 전통적 통계모델인 ARIMA 모델과 머신러닝 모델인 LightGBM을 이용한 예측 모델을 만들어 고도화 dacon.io 개요 프로젝트의 초점은 2021년도에 열렸던 농산물 가격 예측 대회의 데이터를 기반으로 시계열 데이터 분석 및 시계열 예측의 기본기를 다질 수 있도록 구성되어 있습니다. 목표 1. 시계열 데이터 이해와 분석: 시계열 데이터의 기본 구조와 특성, 그리고 주요 분석 기법(e.g., 이동평균, 지수이동평균, 계절성 분해 등)을 이해하고 적용합니다. 2. 데이터 전처리 및 정상성: 누락된 데..

(dacon) 축구선수 유망 여부 예측

dacon 축구선수 유망 여부 예측 예제를 따라해보았다. https://dacon.io/edu/1011 축구선수 유망 여부 예측 프로젝트 축구 선수의 특성 데이터를 살펴보고, 상관관계를 분석해 유망한 선수인지 여부를 판단하세요! dacon.io 데이터 다운로드를 위해 대회에도 등록 https://dacon.io/competitions/official/236031/overview/description 데이콘 Basic 축구선수의 유망 여부 예측 AI 경진대회 - DACON 분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다. dacon.io 목적 본 프로젝트에서는 16~21세의 축구 선수 데이터를 기반으로 유망성을 예측하는 모델을 만들게 됩니다. 특히 상관관계 분석을 학습하고 모델에..

(kaggle) titanic

kaggle 튜토리얼 competition 격인 titanic 분석 https://www.kaggle.com/code/sunghwankang/titanic 최고 점수: 0.79904 (Random Forest) 피쳐: Pclass, Sex, Age, SibSp, Parch, Fare, Embarked Pclass, Sex, Embarked 피쳐 One-Hot 인코딩 numerical 컬럼 결측치 median 사용 XGBoost로 변경 후에 오히려 0.74로 점수가 낮아졌는데, overfitting을 완화하는 방향으로 hyperparameter를 조정하니 0.76으로 약간 상승. 최적 파라미터를 찾기 위한 grid search는 해보지 않음. EDA correlation hm_df = train_data[..