History
home
BDA 연혁
home

Feature_Selection 5 (Lasso, Voting)

1. 범주형 변수(categorical variable) 다루기

많은 머신러닝 모델들은 오직 수치형 변수만을 입력값으로 받는다. 데이터 분석을 진행하면서 범주형 범수에서 중요한 인사이트를 찾았지만, 이를 모델링에 적용할 수 없다면 큰 문제가 생길 것이다. 따라서 범주형 변수를 수치형으로 변환해주는 과정이 필요하다. 하지만 어떻게 범주형 변수가 가지고 있는 정보를 그대로 유지하면서 수치형으로 변환할 수 있을까?
이 중 많이 쓰는 기법이 가변수 (dummy variable)로 처리를 해주는 방법이다.

가변수 처리