History
home
BDA 연혁
home

- 기술통계 데이터 분석(1)

통계학의 구분

통계학은 데이터를 수집, 분석, 해석, 및 표현하는 방법을 다루는 수학의 한 분야이다. 크게 기술통계학(descriptive statistics)과 추론통계학(inferential statistics)으로 나뉜다.
graph TD
  A[통계학] --> B[기술 통계학]
	A[통계학] --> C[추론 통계학]
  B[기술 통계학] --> D[표]
  B[기술 통계학] --> E[그래프]
  B[기술 통계학] --> F[수치 요약]
  C[추론 통계학] --> G[모집단의 특성 추론]
  C[추론 통계학] --> H[모형 설정]
  C[추론 통계학] --> I[가설 검정]
Mermaid
복사

기술통계학 (Descriptive Statistics)

기술통계학은 데이터 집합을 요약하고 설명하는 방법을 다룬다. 이는 데이터 집합의 특징을 명확하게 파악하기 위해 사용된다. 기술통계학에서는 중심 경향성(measures of central tendency)과 변동성(measures of variability) 같은 수치 요약 방법을 사용한다.
중심 경향성: 데이터 집합의 중심이 어디에 위치하는지를 나타내는 지표로, 평균(mean), 중앙값(median), 최빈값(mode) 등이 있다.
변동성: 데이터 값들이 얼마나 퍼져 있는지를 나타내는 지표로, 범위(range), 분산(variance), 표준편차(standard deviation) 등이 있다.

추론통계학 (Inferential Statistics)

추론통계학은 표본 데이터를 기반으로 모집단에 대한 결론을 도출하는 방법을 다룬다. 이는 모집단의 파라미터(모수)를 추정하거나 가설을 검정하는 데 사용된다. 추론통계학은 확률 이론에 기반을 두고 있으며, 표본이 모집단을 대표할 수 있다는 가정 하에 진행된다.
추정(estimation): 모집단의 모수(예: 평균, 비율)에 대한 추정치를 제공한다. 점추정(point estimation)과 구간추정(interval estimation)이 있다.
가설 검정(hypothesis testing): 주어진 가설이 통계적으로 유의미한지를 평가한다. 이 과정에서 귀무가설(null hypothesis)과 대립가설(alternative hypothesis)을 설정하고, 데이터를 분석하여 가설을 지지하는지 판단한다.