History
home
BDA 연혁
home

- 확률과 확률변수 개념

표본공간(Sample space, Ω\Omega)과 사건(Event, AA)

실험(experiment): 결과가 다르게 나타날 수 있는 실험이나 현상
표본공간(sample space): 실험에서 나올 수 있는 모든 결과의 집합, 주로 Ω\Omega로 표기함.
사건(event): 표본공간의 부분집합

확률(Probability)

확률 P:A[0,1]P: \mathcal{A} \rightarrow [0,1]은 사건에 음이 아닌 실수를 매기는 함수로, 다음 세가지 공리를 만족하는 함수이다.
1.
P(A)0, AAP(A) \geq 0, \ \forall A \in \mathcal{A}
2.
P(Ω)=1P(\Omega) = 1
3.
(무한 가법성) 임의의 배반사건 A1,A2,...A_1,A_2,...에 대하여, P(i=1Ai)=i=1P(Ai)P(\bigcup_{i=1}^{\infin} A_i) = \sum_{i=1}^{\infin}P(A_i)

확률의 공리로부터 나오는 특징

1.
ABA \subset B인 두 사건 A,BA,B에 대해 P(A)P(B)P(A) \leq P(B)이다.
2.
P(Ac)=1P(A)P(A^c) = 1-P(A)
3.
(유한 가법성) 임의의 배반사건 A1,A2,...,AnA_1,A_2,...,A_n에 대하여, P(i=1nAi)=i=1nP(Ai)P(\bigcup_{i=1}^{n} A_i) = \sum_{i=1}^{n}P(A_i)이다.
4.
(가법정리) P(AB)=P(A)+P(B)P(AB)P(A \cup B) = P(A) + P(B) - P(A \cap B)
5.
P(A)1P(A) \leq 1
6.
AnAA_n \rightarrow A이면, P(An)P(A) as nP(A_n) \rightarrow P(A) \ \text{as} \ n \rightarrow \infin

확률변수(Random variable)와 확률 분포(Probability distribution)

표본공간에서 실수로 가는 함수 X:ΩRX: \Omega \rightarrow \mathbb{R}를 확률변수라고 한다. 확률 모형 (Ω,P)(\Omega, P)에 대해 확률변수를 통해 새로운 표본공간 S={X(w):wΩ}S = \{ X(w):w\in \Omega \}을 만들 수 있다.
확률 모형 (Ω,P)(\Omega, P), X:ΩRX: \Omega \rightarrow \mathbb{R} 에 대해 다음을 만족하는 확률 PXP_X를 확률변수 XX의 확률 분포라고 한다.
XPX:PX(A)=PX(XA)=PX({wΩ:X(w)A}X \sim P_X: P_X(A) = P_X(X\in A) = P_X(\{ w \in \Omega: X(w) \in A \}
Note. 확률변수 XX의 확률분포 PXP_X는 표본공간 SS에서 정의된 확률이다.

확률질량함수(Probability mass function, PMF)

확률변수 XXx1,x2,..x_1,x_2,..와 같이 가산일 경우, XX를 이산확률변수(discrete random variable)이라고 한다.
이산확률변수 XX에 대해 확률질량함수는 다음과 같이 정의한다.
pX(x)=p(x)=p(X=x)p_X(x) = p(x) =p(X=x)
1.
0p(xi)1, i=1,2,...0 \leq p(x_i) \leq 1, \ \forall i=1,2,...
2.
i=1p(xi)=1\sum_{i=1}^{\infin}p(x_i) = 1

누적분포함수(Cumulative distribution function, CDF)

확률변수 X:ΩRX: \Omega \rightarrow \mathbb{R}의 누적분포함수 F:R[0,1]F: \mathbb{R} \rightarrow [0,1]은 다음과 같이 정의한다.
FX(x)=F(x)=P(Xx), xRF_X(x) = F(x) = P(X\leq x), \ x\in\mathbb{R}
1.
x<yx<y에 대하여, F(x)F(y)F(x) \leq F(y)이다.
2.
모든 xx에 대해 0F(x)10 \leq F(x) \leq 1이고, limxF(x)=0, limxF(x)=1\lim_{x \rightarrow -\infin} F(x) = 0, \ \lim_{x \rightarrow \infin} F(x) = 1
3.
F(x)=F(x+)=limh0,h>0F(x+h), xF(x) = F(x+) = \lim_{h \rightarrow 0, h>0} F(x+h), \ \forall x. 즉 FF는 우연속이다.

확률밀도함수(Probability density function, PDF)

확률변수 X:ΩRX: \Omega \rightarrow \mathbb{R}의 누적분포함수 FF가 모든 xRx \in \mathbb{R}에서 연속일 때, XX를 연속 확률변수라고 한다.
연속확률 변수 X:ΩRX: \Omega \rightarrow \mathbb{R}의 누적분포함수 FF에 대해 다음을 만족하는 함수 ffXX의 확률밀도함수라고 한다.
F(x)=P(Xx)=xf(t)dt, xRF(x) = P(X \leq x) = \int_{-\infin}^x f(t)dt, \ \forall x \in \mathbb{R}
확률밀도함수가 존재하는 연속 확률변수를 절대연속 확률변수라고 한다.
1.
f(x)0, xRf(x) \geq 0, \ \forall x \in \mathbb{R}
2.
f(x)dx=1\int_{-\infin}^{\infin} f(x)dx = 1

기댓값(Expected value)

연속확률변수 X:ΩRX: \Omega \rightarrow \mathbb{R}에 대해,
E(g(X))=g(x)p(x)dx\mathbb{E}(g(X)) = \int_{-\infin}^{\infin}g(x)p(x)dx
이산확률변수 X:ΩRX: \Omega \rightarrow \mathbb{R}에 대해,
ig(xi)p(xi)\sum_ig(x_i)p(x_i)
조건부 기댓값(Conditional expectation)
E(YX=x)=yp(yx)dy, p(yx)=p(x,y)p(y)\mathbb{E}(Y|X=x) = \int yp(y|x)dy, \ p(y|x) = \frac{p(x,y)}{p(y)}
Law of Iterative Expectation(LIE)
E(Y)=E(E(YX))=E(YX=x)pX(x)dx\mathbb{E}(Y) = \mathbb{E}(\mathbb{E}(Y|X)) = \int \mathbb{E}(Y|X=x)p_X(x)dx
Law of Total Variance(LTV)
Var(Y)=Var(E(YX))+E(Var(YX))Var(Y) = Var(\mathbb{E}(Y|X)) + \mathbb{E}(Var(Y|X))