Pandas를 이용한 데이터 분석 맛보기
•
판다스를 이용한 데이터 분석 전처리 맛보기
Numpy를 이용한 데이터 분석 맛보기
•
Numpy를 통한 선형회귀
수업 예시 코드
# 예시 코드
# 함수 def 문자열 전처리 함수 만들기!
def pre_str(x):
new_str=[]
for i in x:
if i not in string.punctuation:
new_str.append(i)
new_str = ''.join(new_str)
return new_str
import pandas
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Emma'],
'Age': [28, 35, 22, 29, 31],
'City': ['New York', 'San Francisco', 'Los Angeles', 'Chicago', 'Boston'],
'Salary': [80000, 95000, 70000, 85000, 90000]
}
df = pd.DataFrame(data)
df.describe()
df.iloc[1,:]
filtered_df = df[df['Age'] > 30]
sorted_df = df.sort_values(by='Salary', ascending=False)
grouped_df = df.groupby('City')['Salary'].mean().reset_index()
## 간단한 선형회귀
import numpy as np
X = 2 * np.random.rand(100, 1)
y = 4 + 3 * X + np.random.randn(100, 1)
X_b = np.c_[np.ones((100, 1)), X] # Add bias term to X
theta_best = np.linalg.inv(X_b.T.dot(X_b)).dot(X_b.T).dot(y)
intercept, slope = theta_best[0], theta_best[1]
Python
복사