현업 실무자에게 배우는 Kaggle 머신러닝 입문

https://inf.run/MKQB

섹션 0. 강의 소개

강의 소개arrow-up-right

섹션 1. 머신러닝이란? - 머신러닝의 개념을 단단히 잡아보자

머신러닝(Machine Learning)의 개념arrow-up-right

분류(Classification) 문제 vs 회귀(Regression) 문제arrow-up-right

지도학습(Supervised Learning), 비지도학습(Unsupervised Learning), 강화학습(Reinforcement Learning)arrow-up-right

트레이닝 데이터(Training Data), 테스트 데이터(Test Data)arrow-up-right

검증용 데이터(Validation Data), 오버피팅(Overfitting)arrow-up-right

섹션 2. 복잡한 설치가 필요없는 간편한 실습환경 - Google Colab 소개

Google Colab 소개arrow-up-right

섹션 3. 머신러닝과 데이터 분석을 위한 도구 - numpy, pandas, matplotlib, seaborn

머신러닝과 데이터 분석을 위한 도구 소개arrow-up-right

numpy, 배열과 행렬을 다루는 도구arrow-up-right

numpy 실습arrow-up-right

pandas, 행과 열을 가진 테이블을 다루는 데이터 분석 도구arrow-up-right

pandas 실습arrow-up-right

고급 pandas 함수들 - concat, groupby, queryarrow-up-right

고급 pandas 함수 실습arrow-up-right

그래프를 그리는 plotting 도구 - matplotlib, seabornarrow-up-right

matplotlib, seaborn 실습arrow-up-right

섹션 4. scikit-learn 소개 & 나의 첫 머신러닝 모델 - 키를 토대로 몸무게를 예측해보자

선형회귀(Linear Regression) 소개arrow-up-right

Regression 알고리즘의 성능평가 지표 - MSE, RMSE, MAEarrow-up-right

scikit-learn 소개arrow-up-right

Linear Regression으로 키에 대한 몸무게 예측해보기arrow-up-right

섹션 5. Kaggle 및 Kaggle Competition 소개

Kaggle 및 Kaggle Competition 소개arrow-up-right

섹션 6. Kaggle 입문 - 타이타닉 승객중 누가 살아남았을까 & 머신러닝으로 타이타닉 생존자 예측해보기

결정 트리(Decision Tree) 소개arrow-up-right

Titanic 사고 데이터 소개arrow-up-right

범주형 컬럼(Categorical Column) & 수치형 컬럼(Numerical Column)arrow-up-right

Categorical Column 다루기 - LabelEncoderarrow-up-right

결정 트리(Decision Tree)를 이용해서 타이타닉 생존자 예측해보기arrow-up-right

섹션 7. Linear Regression 알고리즘 (Ridge, Lasso,

ElasticNet) 뽀개기 & 내 집값은 얼마? - 보스턴 부동산 가격을 예측 해보자

K-Fold Cross Validationarrow-up-right

Feature Engineering - Feature Selectionarrow-up-right

상관 분석(Correlation Analysis) & regplot()arrow-up-right

Regression 알고리즘으로 보스턴 부동산 가격 예측해보기 (EDA & Feature Selection)arrow-up-right

Feature Engineering - Feature Normalizationarrow-up-right

Feature Engineering - Feature Generationarrow-up-right

Ridge & Lasso & ElasticNet Regressionarrow-up-right

보스턴 부동산 가격 예측 성능 향상시켜보기 (Feature Generation & Advanced Estimator)arrow-up-right

섹션 8. 성능 좋고 인기 많은 팔방미인형 예측기 - Random Forest & 머신러닝 모델로 내일 비가 올지 안올지 예측해보자

랜덤 포레스트(Random Forest) 소개arrow-up-right

DataFrame의 .replace() 함수arrow-up-right

범주형(Categorical) 데이터 처리하기 - One-hot Encodingarrow-up-right

Rain in Australia 데이터셋 소개arrow-up-right

Random Forest Classifier로 내일 비가 올지 안올지 예측해보자 - Rain in Australia 데이터셋arrow-up-right

이상치(Outlier) 제거 기법arrow-up-right

Outlier 제거를 통해 Random Forest Classifier 성능 향상 시켜보기 - Rain in Australia 데이터셋arrow-up-right

섹션 9. Kaggle 우승자들이 애용하는 알고리즘 XGBoost & XGBoost로 뇌졸중 발생유무를 예측해보자

XGBoost 소개arrow-up-right

Stroke Preidction 데이터셋 소개arrow-up-right

XGBoost를 이용해서 뇌졸중(Stroke) 발생유무 예측해보기 - Stroke Prediction 데이터셋arrow-up-right

섹션 10. 현업 머신러닝 엔지니어가 들려주는 실무 이야기 - 머신러닝 엔지니어의 일과를 체험해보자

현업 머신러닝 엔지니어 소개arrow-up-right

회사의 머신러닝 팀 구성원arrow-up-right

머신러닝 팀에서 업무를 분배해서 일하는 법arrow-up-right

현업 엔지니어의 하루 – 데이터 엔지니어(Data Engineer)arrow-up-right

현업 엔지니어의 하루 – 데이터 사이언티스트(Data Scientist)arrow-up-right

현업 엔지니어의 하루 – 머신 러닝 엔지니어(Machine Learning Engineer)arrow-up-right

머신러닝 업무에서의 어려웠던 점arrow-up-right

머신러닝 업무를 하면서 느낀 장/단점arrow-up-right

섹션 11. 실무자가 알려주는 DS/ML 실전 팁 - 인정받는 머신러닝 엔지니어로 거듭나보자

실제로 회사에서 진행하는 머신러닝 업무 프로세스arrow-up-right

가장 중요한 것은 데이터, 두 번째로 중요한 것도 데이터arrow-up-right

Kaggle/데이콘과 다르게, 실제 업무에서 중요하게 여기는 것은?arrow-up-right

머신러닝 엔지니어, 일잘러로 거듭나보자arrow-up-right

더 똑똑하게 일 잘하는, 머신러닝 코드 만드는 방법arrow-up-right

가장 몸 값이 비싼 Role, 역량이 무엇일까?arrow-up-right

Last updated