History
home
BDA 연혁
home

- 다양한 확률분포 (1)

이산확률변수의 확률분포

1. 베르누이 분포(Bernoulli distribution)

이산확률변수 XX의 확률질량함수 ppθ[0,1]\theta \in [0,1]에 대해 다음을 만족할 때, XX를 성공확률이 θ\theta인 베르누이 분포를 따른다고 한다. 즉, XBernoulli(θ)X \sim Bernoulli(\theta)
p(x)={1θ if x=0θ        if x=10        o.t.p(x) = \begin{cases} & 1 - \theta \ \text{if } x=0 \\ & \theta \ \ \ \ \ \ \ \ \text{if } x = 1 \\ & 0 \ \ \ \ \ \ \ \ \text{o.t.} \end{cases}
XBernoulli(θ)X \sim Bernoulli(\theta)의 기댓값 E(X)=θ\mathbb{E}(X) = \theta이고, 분산은 Var(X)=θ(1θ)Var(X) = \theta(1-\theta)이다.
Note. 각 시행이 독립적으로 성공 또는 실패 두가지 케이스로 나뉘고, 성공확률이 일정한 베르누이 분포를 따를 때 이를 베르누이 시행이라고 한다.

2. 이항 분포(Binomial distribution)

이산확률변수 XX의 확률질량함수 ppnN, θ[0,1]n \in \mathbb{N}, \ \theta \in [0,1]에 대해 다음을 만족할 때, XX를 시행횟수가 nn, 성공확률이 θ\theta인 이항분포를 따른다고 한다. 즉, XBin(n,θ)X \sim Bin(n,\theta)
p(x)={(nx)θx(1θ)nx if x=0,1,...,n0                         o.t. p(x) = \begin{cases} & {n \choose x}\theta^x(1-\theta)^{n-x} \ \text{if } x=0,1,...,n \\ & 0 \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \text{o.t. } \end{cases}
XBin(n,θ)X \sim Bin(n,\theta)의 기댓값 E(X)=nθ\mathbb{E}(X) = n\theta이고, 분산은 Var(X)=nθ(1θ)Var(X) = n\theta(1-\theta)이다.
Note. 다항분포(Multinomial distribution)
XMultinomial(n,p), X,p=(p1,...,pk)RkX \sim Multinomial(n,p), \ X,p=(p_1,...,p_k) \in \mathbb{R}^k:
p(x)=(nx1,...,xk)i=1kpixip(x) = {n \choose x_1,...,x_k}\prod_{i=1}^k p_i^{x_i}

3. 초기하 분포(Hyper geometric distribution)

이산확률변수 XX의 확률질량함수 ppNmax(n,m)N \geq max(n,m)을 만족하는 n,N,mNn,N,m \in \mathbb{N}에 대해 다음을 만족할 때, XX(n,N,m)(n,N,m)인 초기하 분포를 따른다고 한다.
즉, XHG(n,N,m)X \sim HG(n,N,m)
p(x)={(mx)(Nmnx)(Nn) if x[max(0,nN+m),min(n,m)]Z0              o.t. p(x) = \begin{cases} & \frac{{m \choose x}{N-m \choose n-x}}{{N \choose n}} \ \text{if } x\in [max(0,n-N+m),min(n,m)] \cap \mathbb{Z} \\ & 0 \ \ \ \ \ \ \ \ \ \ \ \ \ \ \text{o.t. } \end{cases}
예시) mm개의 흰 공과 NmN-m개의 검은 공이 들어 있는 주머니에서 nn개의 공을 비복원 추출할 때, 선택된 흰 공의 개수
XBin(n,θ)X \sim Bin(n,\theta)의 기댓값 E(X)=nmN\mathbb{E}(X) = \frac{nm}{N}이고, 분산은 Var(X)=nm(Nm)(Nn)N2(N1)Var(X) = \frac{nm(N-m)(N-n)}{N^2(N-1)}이다.

4. 포아송 분포(Poisson distribution)

이산확률변수 XX의 확률질량함수 ppλ>0\lambda > 0에 대해 다음을 만족할 때, XX를 모수가 λ\lambda인 포아송 분포를 따른다고 한다. 즉, XPoisson(λ)X \sim Poisson(\lambda)
p(x)={eλλxx! if x=0,1,2,...0         o.t. p(x) = \begin{cases} & e^{-\lambda}\frac{\lambda^x}{x!} \ \text{if } x= 0,1,2,... \\ & 0 \ \ \ \ \ \ \ \ \ \text{o.t. } \end{cases}
예시) 특정 구간에서 발생하는 결과의 발생횟수를 모형화할 때 사용
XPoisson(λ)X \sim Poisson(\lambda)의 기댓값 E(X)=λ\mathbb{E}(X) = \lambda이고, 분산은 Var(X)=λVar(X) = \lambda이다.

5. 기하 분포(Geometric distribution)

성공확률이 θ\theta인 베르누이 시행에서 첫 성공까지의 시행 횟수 XX
이산확률변수 XX의 확률질량함수 ppθ[0,1]\theta \in [0,1]에 대해 다음을 만족할 때, XX를 성공확률이 θ\theta인 기하 분포를 따른다고 한다. 즉, XGeo(θ)X \sim Geo(\theta)
p(x)={(1θ)x1θ if x=1,2,...0                  o.t. p(x) = \begin{cases} & (1-\theta)^{x-1}\theta \ \text{if } x= 1,2,... \\ & 0 \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \text{o.t. } \end{cases}
XGeo(θ)X \sim Geo(\theta)의 기댓값 E(X)=1θ\mathbb{E}(X) = \frac{1}{\theta}이고, 분산은 Var(X)=θ(1θ)θ2Var(X) = \frac{\theta(1-\theta)}{\theta^2}이다.
기하분포의 무기억성
XGeo(θ)X \sim Geo(\theta)와 음이 아닌 정수 s,ts,t에 대하여, 다음이 성립한다.
P(X>s+tX>t)=P(X>s)P(X > s+t | X>t) = P(X>s)

6. 음이항 분포(Negative binomial distribution)

성공확률이 θ\theta인 베르누이 시행에서 rr번 성공할 때까지 걸리는 시행 횟수 XX
이산확률변수 XX의 확률질량함수 pprN,θ[0,1]r \in \mathbb{N}, \theta \in [0,1]에 대해 다음을 만족할 때, XX를 모수가 (n,θ)(n,\theta)인 음이항 분포를 따른다고 한다. 즉, XNB(r,θ)X \sim NB(r,\theta)
p(x)={(x1r1)(1θ)xrθr if x=r,r+1,...0                            o.t. p(x) = \begin{cases} & {x-1 \choose r-1}(1-\theta)^{x-r}\theta^r \ \text{if } x= r,r+1,... \\ & 0 \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \text{o.t. } \end{cases}
XNB(r,θ)X \sim NB(r,\theta)의 기댓값 E(X)=rθ\mathbb{E}(X) = \frac{r}{\theta}이고, 분산은 Var(X)=r(1θ)θ2Var(X) = \frac{r(1-\theta)}{\theta^2}이다.