분산분석과 상관분석
분산분석은 두 개 이상의 집단의 평균 사이에 어떤 통계학적 차이가 있는지 분석하는 방법이다. 분산분석에서는 주로 귀무 가설로 ‘여러 집단의 평균이 동일하다’로 잡는데, 분산분석은 이 가설과 함께 서로 다른 집단이 어떻게 반응하거나 나타나는지에 대해 쉽게 이해를 하는데 도움이 되기에 중요한 분석이다. 상관분석은 두 변수 간의 선형적인 관계를 살펴보는 분석 방법이며, 즉 변수 간의 관련성에 대해 쉽게 이해하기 위한 중요한 분석이다. 이번 주차에는 분산분석, 상관분석의 개념과 상관분석에 관련된 계수인 상관계수에 대해 알아볼 것이다.
잔차분석
이번 주차에는 두 개 이상의 변수 사이에 관계에 대한 정보를 알려주는 분석 방법 중 가장 대표적인 방법인 회귀분석에 대해 알아볼 것이다. 그 중 선형 회귀 모형에서의 잔차분석에 대해 알아볼 것인데, 잔차란 관측된 값이 회귀 직선에서 떨어져 있는 정도를 나타낸다. 잔차분석은 오차항의 독립성 여부, 이상치 존재 유무 등을 파악하기에 유용한 분석이다.