History
home
BDA 연혁
home

- 데이터 분석 모듈 & 패키지 응용

Pandas를 이용한 데이터 분석 맛보기
판다스를 이용한 데이터 분석 전처리 맛보기
Numpy를 이용한 데이터 분석 맛보기
Numpy를 통한 선형회귀
수업 예시 코드
# 예시 코드 # 함수 def 문자열 전처리 함수 만들기! def pre_str(x): new_str=[] for i in x: if i not in string.punctuation: new_str.append(i) new_str = ''.join(new_str) return new_str import pandas data = { 'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Emma'], 'Age': [28, 35, 22, 29, 31], 'City': ['New York', 'San Francisco', 'Los Angeles', 'Chicago', 'Boston'], 'Salary': [80000, 95000, 70000, 85000, 90000] } df = pd.DataFrame(data) df.describe() df.iloc[1,:] filtered_df = df[df['Age'] > 30] sorted_df = df.sort_values(by='Salary', ascending=False) grouped_df = df.groupby('City')['Salary'].mean().reset_index() ## 간단한 선형회귀 import numpy as np X = 2 * np.random.rand(100, 1) y = 4 + 3 * X + np.random.randn(100, 1) X_b = np.c_[np.ones((100, 1)), X] # Add bias term to X theta_best = np.linalg.inv(X_b.T.dot(X_b)).dot(X_b.T).dot(y) intercept, slope = theta_best[0], theta_best[1]
Python
복사