History
home
BDA 연혁
home

데이터 분석 전처리 적용반 (21:00 ~ 22:00)

‘데이터 분석 전처리반과 뭐가 다른건가요?

데이터 분석 전처리반은 기본적인 결측치 처리, 시계열•텍스트 전처리 등 상대적으로 쉬운 기초•중급 전처리 과정을 배웁니다.
데이터 분석 전처리 적용반은 Feature Selection, 불균형 데이터 처리, 스케일링 등의 고급 전처리 기법을 다루고 머신러닝 모델 성능 개선까지 실습으로 진행합니다.
[Comment] 위 설명만 보았을 때 순서대로 수강을 해야하나 생각이 들 수 있습니다. 두 과정 모두 데이터 전처리를 다루지만, 배우는 범위와 방식이 다르기에 반드시 순차적으로 들어야 하는 선수 과목은 아닙니다. 개별로 필요한 학습 범위나 관심 영역에 따라 자유롭게 선택하시면 됩니다.

특징(Feature) 선택, 가공(엔지니어링)과 같은 전처리 기법을 배우고 모델의 성능을 개선할 수 있습니다.

[어떤 것을 배우나요?]
Pandas, Numpy 등 기초 데이터 분석 문법 복습
데이터 전처리를 통한 모델 성능 평가 최적의 전처리 방향성 확인
Kaggle 마스터의 전처리 코드를 뜯어보며 이해하고 해석하기

어떤 사람에게 추천하나요?

[이런 분을 추천합니다]
데이터 분석 전처리에 대해 정확한 개념이 안 잡히고 전처리의 방향성에 어려움을 느끼신 분
전처리를 통해 ML 성능을 올리고 데이터 정제를 하고 싶으신 분
특징(Feature) 선택과 가공(엔지니어링)에 대해서 배우고 싶으신 분

이전 기수의 수업을 확인해보세요

신청 전 확인하기!

본 강의는 데이터 전처리에 관한 기초문법 복습 이후 Feature Selection, 성능 개선 기법(Regression/Classification), 모델링 성능 향상 등에 대해 배우게 됩니다. 또한, 데이터 분석 입문반(ML)에서 배우는 내용을 어느 정도 숙지하고 있다 가정하고 수업을 진행합니다. 이에 대한 개념이 부족한 경우 수업을 따라가는데 어려움이 있을 수 있습니다. 이 경우 “데이터 분석 입문반(ML)” 수강을 권장합니다.
권장 수업 페이지로 이동하기
데이터 분석 전처리반의 커리큘럼을 확인 후 알고 있는 내용이라면 다음 과목 수강을 권장합니다. - Pandas를 완전히 익히고 분석 역량을 높이고자 하는 분은 “데이터 분석 실전반 - 지표설계 및 고객분석” 수강을 권장합니다.

커리큘럼

1주차 : 데이터 전처리의 중요성

2주차 : Feature_Selection 1 (상관계수, 거리기반)

3주차 : Feature_Selection 2 (Filter Method)

4주차 : Feature_Selection 3 (SFS)

5주차 : Feature_Selection 4 (REF, REFCV)

6주차 : Feature_Selection 5 (boruta)

7주차 : Feature_Selection 6 (shap)

8주차 : Feature_Selection 7 (LIME)

9주차 : Feature_Selection 8 (Lasso, Voting)

10주차 :데이터 전처리 성능 개선 1 (Regression)

11주차 : 데이터 전처리 성능 개선 2 (Regression)

12주차 : 데이터 전처리 성능 개선 1 (Classification)

13주차 : 데이터 전처리 성능 개선 2 (Classification)

14주차 : 머신 러닝 기초 알고리즘

15주차 : 전처리를 통한 모델링 성능 향상1

16주차 : 전처리를 통한 모델링 성능 향상2