현업 실무자에게 배우는 Kaggle 머신러닝 입문

https://inf.run/MKQB

섹션 0. 강의 소개

강의 소개

섹션 1. 머신러닝이란? - 머신러닝의 개념을 단단히 잡아보자

머신러닝(Machine Learning)의 개념

분류(Classification) 문제 vs 회귀(Regression) 문제

지도학습(Supervised Learning), 비지도학습(Unsupervised Learning), 강화학습(Reinforcement Learning)

트레이닝 데이터(Training Data), 테스트 데이터(Test Data)

검증용 데이터(Validation Data), 오버피팅(Overfitting)

섹션 2. 복잡한 설치가 필요없는 간편한 실습환경 - Google Colab 소개

Google Colab 소개

섹션 3. 머신러닝과 데이터 분석을 위한 도구 - numpy, pandas, matplotlib, seaborn

머신러닝과 데이터 분석을 위한 도구 소개

numpy, 배열과 행렬을 다루는 도구

numpy 실습

pandas, 행과 열을 가진 테이블을 다루는 데이터 분석 도구

pandas 실습

고급 pandas 함수들 - concat, groupby, query

고급 pandas 함수 실습

그래프를 그리는 plotting 도구 - matplotlib, seaborn

matplotlib, seaborn 실습

섹션 4. scikit-learn 소개 & 나의 첫 머신러닝 모델 - 키를 토대로 몸무게를 예측해보자

선형회귀(Linear Regression) 소개

Regression 알고리즘의 성능평가 지표 - MSE, RMSE, MAE

scikit-learn 소개

Linear Regression으로 키에 대한 몸무게 예측해보기

섹션 5. Kaggle 및 Kaggle Competition 소개

Kaggle 및 Kaggle Competition 소개

섹션 6. Kaggle 입문 - 타이타닉 승객중 누가 살아남았을까 & 머신러닝으로 타이타닉 생존자 예측해보기

결정 트리(Decision Tree) 소개

Titanic 사고 데이터 소개

범주형 컬럼(Categorical Column) & 수치형 컬럼(Numerical Column)

Categorical Column 다루기 - LabelEncoder

결정 트리(Decision Tree)를 이용해서 타이타닉 생존자 예측해보기

섹션 7. Linear Regression 알고리즘 (Ridge, Lasso,

ElasticNet) 뽀개기 & 내 집값은 얼마? - 보스턴 부동산 가격을 예측 해보자

K-Fold Cross Validation

Feature Engineering - Feature Selection

상관 분석(Correlation Analysis) & regplot()

Regression 알고리즘으로 보스턴 부동산 가격 예측해보기 (EDA & Feature Selection)

Feature Engineering - Feature Normalization

Feature Engineering - Feature Generation

Ridge & Lasso & ElasticNet Regression

보스턴 부동산 가격 예측 성능 향상시켜보기 (Feature Generation & Advanced Estimator)

섹션 8. 성능 좋고 인기 많은 팔방미인형 예측기 - Random Forest & 머신러닝 모델로 내일 비가 올지 안올지 예측해보자

랜덤 포레스트(Random Forest) 소개

DataFrame의 .replace() 함수

범주형(Categorical) 데이터 처리하기 - One-hot Encoding

Rain in Australia 데이터셋 소개

Random Forest Classifier로 내일 비가 올지 안올지 예측해보자 - Rain in Australia 데이터셋

이상치(Outlier) 제거 기법

Outlier 제거를 통해 Random Forest Classifier 성능 향상 시켜보기 - Rain in Australia 데이터셋

섹션 9. Kaggle 우승자들이 애용하는 알고리즘 XGBoost & XGBoost로 뇌졸중 발생유무를 예측해보자

XGBoost 소개

Stroke Preidction 데이터셋 소개

XGBoost를 이용해서 뇌졸중(Stroke) 발생유무 예측해보기 - Stroke Prediction 데이터셋

섹션 10. 현업 머신러닝 엔지니어가 들려주는 실무 이야기 - 머신러닝 엔지니어의 일과를 체험해보자

현업 머신러닝 엔지니어 소개

회사의 머신러닝 팀 구성원

머신러닝 팀에서 업무를 분배해서 일하는 법

현업 엔지니어의 하루 – 데이터 엔지니어(Data Engineer)

현업 엔지니어의 하루 – 데이터 사이언티스트(Data Scientist)

현업 엔지니어의 하루 – 머신 러닝 엔지니어(Machine Learning Engineer)

머신러닝 업무에서의 어려웠던 점

머신러닝 업무를 하면서 느낀 장/단점

섹션 11. 실무자가 알려주는 DS/ML 실전 팁 - 인정받는 머신러닝 엔지니어로 거듭나보자

실제로 회사에서 진행하는 머신러닝 업무 프로세스

가장 중요한 것은 데이터, 두 번째로 중요한 것도 데이터

Kaggle/데이콘과 다르게, 실제 업무에서 중요하게 여기는 것은?

머신러닝 엔지니어, 일잘러로 거듭나보자

더 똑똑하게 일 잘하는, 머신러닝 코드 만드는 방법

가장 몸 값이 비싼 Role, 역량이 무엇일까?

Last updated

Was this helpful?