수학/푸아송 과정과 확률 분포

이항분포 -> 푸아송 분포

FedTensor 2025. 11. 27. 18:05

푸아송 분포(Poisson Distribution)는 이항분포(Binomial Distribution)의 특수한 극한 형태로 유도하는 것이 가장 일반적이고 직관적입니다.

단위 시간(또는 단위 공간) 안에 어떤 사건이 몇 번 발생할 것인지를 표현하는 이 분포는, "시행 횟수($n$)는 무수히 많고, 발생 확률($p$)은 매우 희박할 때"의 확률 분포입니다.

다음은 이항분포에서 출발하여 푸아송 분포의 수식을 유도하는 단계별 과정입니다.

1. 기본 설정: 이항분포에서 출발

먼저, 확률 변수 $X$가 시행 횟수 $n$, 성공 확률 $p$인 이항분포를 따른다고 가정합니다.

$$X \sim B(n, p)$$

이때 $k$번 성공할 확률 질량 함수(PMF)는 다음과 같습니다.

$$P(X=k) = \binom{n}{k} p^k (1-p)^{n-k}$$

2. 푸아송 분포의 조건 적용 (극한)

푸아송 분포로 넘어가기 위해 다음 두 가지 조건을 적용합니다.

  1. 시행 횟수의 무한대: $n \to \infty$
  2. 평균 발생 횟수의 고정: $np = \lambda$ (상수)
    • 즉, $p = \frac{\lambda}{n}$ 입니다. ($n$이 커질수록 확률 $p$는 0에 수렴)

이제 이항분포 식에 $p = \frac{\lambda}{n}$를 대입하고 $n$을 무한대로 보내는 극한을 취합니다.

$$\lim_{n \to \infty} P(X=k) = \lim_{n \to \infty} \binom{n}{k} \left(\frac{\lambda}{n}\right)^k \left(1-\frac{\lambda}{n}\right)^{n-k}$$

3. 수식 전개 및 정리

위 식을 계산하기 편하게 항별로 풀어서 정리해보겠습니다.

① 조합(Combination) 기호 풀기

$$\binom{n}{k} = \frac{n(n-1)(n-2)\cdots(n-k+1)}{k!}$$


② 식 재배열

위의 조합 식을 대입하여 전체 식을 다시 쓰면:

$$= \lim_{n \to \infty} \left[ \frac{n(n-1)\cdots(n-k+1)}{k!} \cdot \frac{\lambda^k}{n^k} \cdot \left(1-\frac{\lambda}{n}\right)^n \cdot \left(1-\frac{\lambda}{n}\right)^{-k} \right]$$

이제 극한값을 구하기 쉽도록 상수항($k!$, $\lambda^k$)과 $n$에 관련된 항들을 묶어서 정리합니다.

$$= \frac{\lambda^k}{k!} \cdot \lim_{n \to \infty} \left[ \frac{n(n-1)\cdots(n-k+1)}{n^k} \cdot \left(1-\frac{\lambda}{n}\right)^n \cdot \left(1-\frac{\lambda}{n}\right)^{-k} \right]$$

4. 극한값 계산

이제 대괄호 안의 세 부분에 대해 각각 극한을 취해봅시다.

Step A: 첫 번째 항

$$\lim_{n \to \infty} \frac{n(n-1)\cdots(n-k+1)}{n^k}$$

분자는 $n$에 대한 $k$차 다항식이고, 분모도 $n^k$입니다. $n$이 무한대로 가면 최고차항의 계수만 남으므로 이 값은 1이 됩니다. (직관적으로, $n$이 매우 크면 $n \approx n-1 \approx n-k+1$이므로 약분되어 1이 됩니다.)

Step B: 두 번째 항 (자연상수 정의 활용)

$$\lim_{n \to \infty} \left(1-\frac{\lambda}{n}\right)^n$$

자연상수 $e$의 정의($\lim_{x \to \infty} (1+\frac{1}{x})^x = e$)에 의해, 이 식은 $e^{-\lambda}$로 수렴합니다.

Step C: 세 번째 항

$$\lim_{n \to \infty} \left(1-\frac{\lambda}{n}\right)^{-k}$$

$n \to \infty$일 때, $\frac{\lambda}{n} \to 0$입니다. $k$는 유한한 상수이므로, $(1-0)^{-k} = 1^{-k} =$ 1이 됩니다.

5. 최종 결과: 푸아송 분포 공식

위에서 구한 극한값들을 모두 곱하면 최종적으로 푸아송 분포의 확률 질량 함수가 유도됩니다.

$$P(X=k) = \frac{\lambda^k}{k!} \cdot 1 \cdot e^{-\lambda} \cdot 1$$

$$\therefore P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!}$$

요약 및 의미

  • $\lambda$ (람다): 정해진 시간이나 구간 내에서 발생하는 사건의 평균 횟수 ($np$)
  • $k$: 그 구간 내에서 사건이 실제로 발생하는 횟수 ($0, 1, 2, \dots$)
  • 의미: 평균적으로 $\lambda$번 발생하는 사건이 특정 시점에 $k$번 발생할 확률을 나타냅니다.

이 유도 과정은 "시행 횟수가 아주 많고 확률이 아주 낮은 사건(희귀 사건)"을 다룰 때 왜 이항분포 대신 푸아송 분포를 사용하는지를 수학적으로 보여줍니다.