History
home
BDA 연혁
home

- 다양한 데이터 형태 전처리 복습 (3)

전처리 과정 실습해보기

다음과 같이 유럽의 인구 관련 데이터가 주어져있다고 해보자.
euro_cities.csv
4.9KB
‘Population’의 데이터 타입이 object이고, 쉼표를 포함하고 있다. 이를 쉼표를 제거하고 수치형데이터로 바꿔 ‘numericpopulation’라는 새로운 컬럼을 생성하여 저장해보자.
정답 코드
이번에는 ‘City’이름으로 오름차순 정렬하여 데이터를 확인해보자.
정답 코드
State’와 ‘City’에 대해 계층적으로 정렬해보자.
정답 코드
State’가 ‘Sweden’에 해당하는 도시 데이터만 인덱싱해보자.
정답 코드
State’의 인구 합산하여 내림차순으로 정렬하고, 상위 10개를 표시해보자.
정답 코드
State’의 인구 합산이 가장 높은 5개 국가에 속한 도시 중 인구가 가장 많은 도시를 표시해보자.
정답 코드