수학/푸아송 과정과 확률 분포

푸아송 분포 -> 지수 분포

FedTensor 2025. 11. 27. 22:29

지수 분포의 수식을 유도하는 가장 논리적이고 표준적인 방법은 푸아송 과정(Poisson Process)에서 출발하는 것입니다.

지수 분포는 '사건이 발생할 때까지 걸리는 시간'에 대한 분포이고, 푸아송 분포는 '특정 시간 동안 발생하는 사건의 횟수'에 대한 분포입니다. 이 둘은 동전의 양면과 같습니다.

이 관계를 이용하여 지수 분포의 확률 밀도 함수(PDF)인 $f(t) = \lambda e^{-\lambda t}$를 유도해 보겠습니다.

1. 전제 조건: 푸아송 분포

단위 시간당 평균 $\lambda$번 발생하는 사건이 있다고 가정합니다. 시간 $t$ 동안 사건이 총 $k$번 발생할 확률 $P(N(t)=k)$는 푸아송 분포를 따르며 다음과 같습니다.

$$P(N(t) = k) = \frac{(\lambda t)^k e^{-\lambda t}}{k!}$$

  • $N(t)$: 시간 $0$부터 $t$까지 발생한 사건의 횟수 (확률 변수)
  • $\lambda$: 단위 시간당 사건 발생률 (Rate parameter)
  • $t$: 관측한 시간

2. 핵심 아이디어: "대기 시간"의 정의

우리가 구하고 싶은 것은 첫 번째 사건이 발생할 때까지 걸리는 시간을 확률 변수 $T$라고 할 때, $T$의 확률 분포입니다.

논리적 연결 고리는 다음과 같습니다:


"시간 $t$가 지날 때까지 첫 번째 사건이 아직 발생하지 않았다 ($T > t$)"는 말은
"시간 $0$부터 $t$까지 발생한 사건의 횟수가 0회이다 ($N(t) = 0$)"는 말과 완전히 같습니다.

이를 수식으로 표현하면:

$$P(T > t) = P(N(t) = 0)$$

3. 유도 과정

단계 1: 생존 함수(Survival Function) 구하기

위의 핵심 아이디어에 따라, $N(t)=0$을 푸아송 공식에 대입합니다. ($k=0$ 대입)

$$P(T > t) = P(N(t) = 0) = \frac{(\lambda t)^0 e^{-\lambda t}}{0!}$$

$0! = 1$이고, $(\lambda t)^0 = 1$이므로,

$$P(T > t) = e^{-\lambda t}$$

이것이 바로 $t$시간 이상 대기할 확률입니다.

단계 2: 누적 분포 함수(CDF) 구하기

확률의 전체 합은 1이므로, 시간 $t$ 이내에 사건이 발생할 확률(CDF), $F(t)$는 다음과 같습니다.

$$F(t) = P(T \le t) = 1 - P(T > t)$$

$$F(t) = 1 - e^{-\lambda t} \quad (t \ge 0)$$

단계 3: 확률 밀도 함수(PDF) 구하기

확률 밀도 함수 $f(t)$는 누적 분포 함수 $F(t)$를 $t$에 대해 미분하여 얻을 수 있습니다.

$$f(t) = \frac{d}{dt} F(t) = \frac{d}{dt} (1 - e^{-\lambda t})$$

상수 1은 미분하면 0이 되고, 지수 함수의 미분 법칙($\frac{d}{dx}e^{ax} = ae^{ax}$)을 적용하면:

$$f(t) = 0 - (-\lambda)e^{-\lambda t}$$

4. 최종 결과

따라서, 지수 분포의 확률 밀도 함수는 다음과 같이 유도됩니다.

$$f(t) = \lambda e^{-\lambda t} \quad (t \ge 0)$$

이 유도 과정은 이산적인 사건(푸아송)이 극한의 상황에서 어떻게 연속적인 시간(지수 분포)으로 연결되는지를 보여줍니다.