푸아송 분포(Poisson Distribution)는 이항분포(Binomial Distribution)의 특수한 극한 형태로 유도하는 것이 가장 일반적이고 직관적입니다.
단위 시간(또는 단위 공간) 안에 어떤 사건이 몇 번 발생할 것인지를 표현하는 이 분포는, "시행 횟수($n$)는 무수히 많고, 발생 확률($p$)은 매우 희박할 때"의 확률 분포입니다.
다음은 이항분포에서 출발하여 푸아송 분포의 수식을 유도하는 단계별 과정입니다.
1. 기본 설정: 이항분포에서 출발
먼저, 확률 변수 $X$가 시행 횟수 $n$, 성공 확률 $p$인 이항분포를 따른다고 가정합니다.
$$X \sim B(n, p)$$
이때 $k$번 성공할 확률 질량 함수(PMF)는 다음과 같습니다.
$$P(X=k) = \binom{n}{k} p^k (1-p)^{n-k}$$
2. 푸아송 분포의 조건 적용 (극한)
푸아송 분포로 넘어가기 위해 다음 두 가지 조건을 적용합니다.
- 시행 횟수의 무한대: $n \to \infty$
- 평균 발생 횟수의 고정: $np = \lambda$ (상수)
- 즉, $p = \frac{\lambda}{n}$ 입니다. ($n$이 커질수록 확률 $p$는 0에 수렴)
이제 이항분포 식에 $p = \frac{\lambda}{n}$를 대입하고 $n$을 무한대로 보내는 극한을 취합니다.
$$\lim_{n \to \infty} P(X=k) = \lim_{n \to \infty} \binom{n}{k} \left(\frac{\lambda}{n}\right)^k \left(1-\frac{\lambda}{n}\right)^{n-k}$$
3. 수식 전개 및 정리
위 식을 계산하기 편하게 항별로 풀어서 정리해보겠습니다.
① 조합(Combination) 기호 풀기
$$\binom{n}{k} = \frac{n(n-1)(n-2)\cdots(n-k+1)}{k!}$$
② 식 재배열
위의 조합 식을 대입하여 전체 식을 다시 쓰면:
$$= \lim_{n \to \infty} \left[ \frac{n(n-1)\cdots(n-k+1)}{k!} \cdot \frac{\lambda^k}{n^k} \cdot \left(1-\frac{\lambda}{n}\right)^n \cdot \left(1-\frac{\lambda}{n}\right)^{-k} \right]$$
이제 극한값을 구하기 쉽도록 상수항($k!$, $\lambda^k$)과 $n$에 관련된 항들을 묶어서 정리합니다.
$$= \frac{\lambda^k}{k!} \cdot \lim_{n \to \infty} \left[ \frac{n(n-1)\cdots(n-k+1)}{n^k} \cdot \left(1-\frac{\lambda}{n}\right)^n \cdot \left(1-\frac{\lambda}{n}\right)^{-k} \right]$$
4. 극한값 계산
이제 대괄호 안의 세 부분에 대해 각각 극한을 취해봅시다.
Step A: 첫 번째 항
$$\lim_{n \to \infty} \frac{n(n-1)\cdots(n-k+1)}{n^k}$$
분자는 $n$에 대한 $k$차 다항식이고, 분모도 $n^k$입니다. $n$이 무한대로 가면 최고차항의 계수만 남으므로 이 값은 1이 됩니다. (직관적으로, $n$이 매우 크면 $n \approx n-1 \approx n-k+1$이므로 약분되어 1이 됩니다.)
Step B: 두 번째 항 (자연상수 정의 활용)
$$\lim_{n \to \infty} \left(1-\frac{\lambda}{n}\right)^n$$
자연상수 $e$의 정의($\lim_{x \to \infty} (1+\frac{1}{x})^x = e$)에 의해, 이 식은 $e^{-\lambda}$로 수렴합니다.
Step C: 세 번째 항
$$\lim_{n \to \infty} \left(1-\frac{\lambda}{n}\right)^{-k}$$
$n \to \infty$일 때, $\frac{\lambda}{n} \to 0$입니다. $k$는 유한한 상수이므로, $(1-0)^{-k} = 1^{-k} =$ 1이 됩니다.
5. 최종 결과: 푸아송 분포 공식
위에서 구한 극한값들을 모두 곱하면 최종적으로 푸아송 분포의 확률 질량 함수가 유도됩니다.
$$P(X=k) = \frac{\lambda^k}{k!} \cdot 1 \cdot e^{-\lambda} \cdot 1$$
$$\therefore P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!}$$
요약 및 의미
- $\lambda$ (람다): 정해진 시간이나 구간 내에서 발생하는 사건의 평균 횟수 ($np$)
- $k$: 그 구간 내에서 사건이 실제로 발생하는 횟수 ($0, 1, 2, \dots$)
- 의미: 평균적으로 $\lambda$번 발생하는 사건이 특정 시점에 $k$번 발생할 확률을 나타냅니다.
이 유도 과정은 "시행 횟수가 아주 많고 확률이 아주 낮은 사건(희귀 사건)"을 다룰 때 왜 이항분포 대신 푸아송 분포를 사용하는지를 수학적으로 보여줍니다.
'수학 > 푸아송 과정과 확률 분포' 카테고리의 다른 글
| 감마 분포 -> 디리클레 분포 (0) | 2025.11.28 |
|---|---|
| 지수 분포 -> 감마 분포 (0) | 2025.11.27 |
| 푸아송 분포 -> 지수 분포 (0) | 2025.11.27 |
| 이항 분포에서 Non-IID까지: 확률 분포의 연결 고리와 응용 (0) | 2025.11.27 |
| 푸아송 과정(Poisson Process) (0) | 2025.11.26 |