History
home
BDA 연혁
home

- 데이터 분석 입문 ( 선형회귀 잔차, 계수란?) (1)

분산분석과 상관분석

분산분석은 두 개 이상의 집단의 평균 사이에 어떤 통계학적 차이가 있는지 분석하는 방법이다. 분산분석에서는 주로 귀무 가설로 ‘여러 집단의 평균이 동일하다’로 잡는데, 분산분석은 이 가설과 함께 서로 다른 집단이 어떻게 반응하거나 나타나는지에 대해 쉽게 이해를 하는데 도움이 되기에 중요한 분석이다. 상관분석은 두 변수 간의 선형적인 관계를 살펴보는 분석 방법이며, 즉 변수 간의 관련성에 대해 쉽게 이해하기 위한 중요한 분석이다. 이번 주차에는 분산분석, 상관분석의 개념과 상관분석에 관련된 계수인 상관계수에 대해 알아볼 것이다.

잔차분석

이번 주차에는 두 개 이상의 변수 사이에 관계에 대한 정보를 알려주는 분석 방법 중 가장 대표적인 방법인 회귀분석에 대해 알아볼 것이다. 그 중 선형 회귀 모형에서의 잔차분석에 대해 알아볼 것인데, 잔차란 관측된 값이 회귀 직선에서 떨어져 있는 정도를 나타낸다. 잔차분석은 오차항의 독립성 여부, 이상치 존재 유무 등을 파악하기에 유용한 분석이다.

분산분석, 상관분석 관련 용어

선형 회귀 분석 관련 용어

summary 해석

수업 키워드

실습 코드 요약