통계학(Statistics)의 발전 과정
통계학(statistics)은 데이터의 수집, 분석, 해석, 그리고 데이터로부터의 결론 도출을 다루는 학문이다. 그 어원은 라틴어 'status'에서 유래되었으며, 초기에는 국가의 인구, 군사력, 경제 상태 등 국가의 상태를 기록하고 평가하는 데 사용되었다.
근대 통계학의 발전
근대 통계학은 17세기와 18세기에 확률론과 함께 발전하기 시작했다. 초기의 주요 관심사는 도박과 게임에 대한 확률 계산이었지만, 점차 과학적 실험과 사회과학 연구에 적용되기 시작했다.
확률론의 발전과 통계학
•
대수의 법칙(Law of Large Numbers, LLN): 대수의 법칙은 표본의 크기가 커질수록 표본 평균이 모평균에 가까워진다는 원리이다. 이 법칙은 확률론에서 중요한 개념으로, 통계학에서도 광범위하게 사용된다.
•
중심극한정리(Central Limit Theorem, CLT): 중심극한정리는 독립적이고 동일하게 분포된 확률 변수들의 합(또는 평균)이 충분히 큰 표본에서 정규분포에 가까워진다는 원리이다. 이는 표본 분포의 예측 가능성을 제공하며, 많은 통계적 추론 기법의 기초를 이룬다.
•
정규분포(Normal Distribution): 정규분포는 자연과학과 사회과학 전반에서 관찰되는 많은 현상들을 모델링하는 데 사용된다. 중심극한정리 덕분에, 많은 독립적인 랜덤 변수들의 합은 정규분포를 따르게 된다.
추론 통계학의 탄생
19세기 후반부터 20세기 초, 추론 통계학이 발전하기 시작했다. 이는 데이터로부터 모집단의 특성을 추론하는 방법을 개발하는 데 초점을 맞추었다.
•
로널드 피셔(Sir Ronald A. Fisher): 피셔는 실험 설계, 분산분석(ANOVA), 최대우도추정법, 피셔의 정확검정 등 많은 중요한 통계적 방법론을 개발했다. 그는 추론 통계학의 아버지로 불리며, 현대 통계학의 발전에 결정적인 기여를 했다.
•
칼 피어슨(Karl Pearson): 피어슨은 상관계수, χ² 검정(카이제곱 검정), 피어슨의 분포 등을 개발했다. 그는 통계학의 수학적 기반을 강화하고, 생물학적 문제에 통계적 방법을 적용하는 데 기여했다.
추론 통계학의 발전
•
헨리 셰페(Henry Scheffé): 셰페는 분산 분석(ANOVA)과 관련된 작업으로 잘 알려져 있다. 그의 주요 기여 중 하나는 셰페의 방법으로, 다중 비교 문제에서 모든 쌍의 평균 차이에 대한 동시 신뢰구간을 제공한다. 이 방법은 실험 설계와 분석에서 널리 사용되며, 복잡한 실험 데이터를 분석할 때 여러 가설을 동시에 테스트하는 데 유용하다.
•
월터 A. 슈하트(Walter A. Shewhart): 슈하트는 품질 관리의 아버지로 불리며 제어 차트(control charts)와 품질 관리의 과학적 방법을 개발했다. 제어 차트는 생산 과정에서 품질 변동을 모니터링하고 공정이 통제 상태에 있는지 여부를 판단하는 데 사용된다. 슈하트는 제조 및 서비스 산업 전반에 걸쳐 품질 관리의 기준을 마련했다.
•
아브라함 왈드(Abraham Wald): 왈드는 순차 분석(sequential analysis)의 개발로 유명하다. 순차 분석은 데이터를 순차적으로 분석하여 가능한 한 빨리 결정을 내릴 수 있는 통계적 방법이다. 이 방법은 제2차 세계대전 중 군사 작전의 효율성을 증가시키기 위해 개발되었으며, 이후 의료, 금융 및 산업 공정 등 다양한 분야에서 응용되었다.
•
조지 에드워드 펠럼 박스(George E.P. Box): 박스는 실험 설계와 통계적 프로세스 제어에 중요한 기여를 한 인물이다. 그는 Box-Jenkins 모델을 공동 개발했으며, 이 모델은 시계열 데이터 분석에서 널리 사용된다. 또한, 그는 Box-Cox 변환을 제안하여 데이터를 정규 분포에 가깝게 변환하는 방법을 소개했다. 박스의 작업은 과학적 연구와 산업 응용 모두에서 실험 설계와 데이터 분석 방법을 향상시켰다.