- 데이터 분석 모듈 & 패키지 응용

Pandas를 이용한 데이터 분석 맛보기

•

판다스를 이용한 데이터 분석 전처리 맛보기

Numpy를 이용한 데이터 분석 맛보기

•

Numpy를 통한 선형회귀 

수업 예시 코드

# 예시 코드
# 함수 def 문자열 전처리 함수 만들기!
def pre_str(x):
    new_str=[]
    for i in x:
        if i not in string.punctuation:
            new_str.append(i)
    new_str = ''.join(new_str)
    return new_str

import pandas

data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Emma'],
    'Age': [28, 35, 22, 29, 31],
    'City': ['New York', 'San Francisco', 'Los Angeles', 'Chicago', 'Boston'],
    'Salary': [80000, 95000, 70000, 85000, 90000]
}

df = pd.DataFrame(data)

df.describe()
df.iloc[1,:]
filtered_df = df[df['Age'] > 30]
sorted_df = df.sort_values(by='Salary', ascending=False)
grouped_df = df.groupby('City')['Salary'].mean().reset_index()

## 간단한 선형회귀
import numpy as np

X = 2 * np.random.rand(100, 1)
y = 4 + 3 * X + np.random.randn(100, 1)

X_b = np.c_[np.ones((100, 1)), X]  # Add bias term to X
theta_best = np.linalg.inv(X_b.T.dot(X_b)).dot(X_b.T).dot(y)
intercept, slope = theta_best[0], theta_best[1]
Python
복사