수학/푸아송 과정과 확률 분포

지수 분포 -> 감마 분포

FedTensor 2025. 11. 27. 23:42

지수 분포가 '첫 번째 사건'이 발생할 때까지의 시간이라면, 감마 분포(Gamma Distribution)는 이를 일반화하여 '$k$번째 사건'이 발생할 때까지의 시간을 모델링합니다.

지수 분포 유도 때와 마찬가지로 푸아송 과정(Poisson Process)을 기반으로 아주 직관적인 방법(미소 구간 확률)을 사용하여 유도할 수 있습니다.

1. 목표 설정: 무엇을 구하는가?

  • 상황: 사건이 평균적으로 단위 시간당 $\lambda$회 발생하는 푸아송 과정.
  • 확률 변수 $T$: $k$번째 사건이 발생할 때까지 걸리는 시간.
  • 목표: $T$의 확률 밀도 함수(PDF) $f(t)$ 구하기.

2. 직관적 유도 (미소 구간 접근법)

확률 밀도 함수 $f(t)$의 정의를 생각해 봅시다. $f(t)dt$는 '정확히 시간 $t$ 시점에($t$와 $t+dt$ 사이) $k$번째 사건이 발생할 확률'입니다.

이 상황이 발생하려면 다음 두 가지 조건이 동시에 충족되어야 합니다.

  1. 조건 A: 시간 $0$부터 $t$까지 정확히 $k-1$번의 사건이 이미 발생해 있어야 합니다.
  2. 조건 B: 아주 짧은 시간 $dt$ 동안 정확히 1번의 사건이 발생해야 합니다(이것이 $k$번째 사건이 됨).

이를 수식으로 옮겨보겠습니다.

단계 1: 조건 A의 확률 (푸아송 분포)

시간 $t$ 동안 사건이 $k-1$번 발생할 확률은 푸아송 확률 공식에 $n=k-1$을 대입하면 됩니다.

$$P(A) = \frac{e^{-\lambda t}(\lambda t)^{k-1}}{(k-1)!}$$

단계 2: 조건 B의 확률 (사건 발생률)

매우 짧은 시간 $dt$ 동안 사건이 발생할 확률은 발생률 $\lambda$에 비례합니다. (지수 분포의 성질이자 푸아송 과정의 정의)

$$P(B) \approx \lambda dt$$

단계 3: 결합 (PDF 완성)

두 사건은 독립적이므로 확률을 곱합니다.

$$f(t)dt \approx P(A) \times P(B)$$

$$f(t)dt = \left( \frac{e^{-\lambda t}(\lambda t)^{k-1}}{(k-1)!} \right) \times (\lambda dt)$$

양변의 $dt$를 약분하고 정리하면, $k$번째 사건이 발생할 때까지의 대기 시간 분포인 얼랑 분포(Erlang Distribution)의 PDF가 나옵니다. (얼랑 분포는 감마 분포의 정수 버전입니다.)

$$f(t) = \frac{\lambda (\lambda t)^{k-1} e^{-\lambda t}}{(k-1)!} = \frac{\lambda^k t^{k-1} e^{-\lambda t}}{(k-1)!}$$

3. 일반화: 팩토리얼에서 감마 함수로

위의 식은 $k$가 '1번째, 2번째...'처럼 정수(Integer)일 때만 유효합니다. 이를 실수(Real number) 범위까지 확장하기 위해 수학적 도구를 바꿉니다.

  • 팩토리얼의 일반화: $(k-1)!$은 정수에서만 정의되지만, 이를 실수 $\alpha$로 확장한 것이 감마 함수 $\Gamma(\alpha)$입니다.
    • $\Gamma(k) = (k-1)!$ (단, $k$는 정수)
    • $\Gamma(\alpha) = \int_{0}^{\infty} x^{\alpha-1} e^{-x} dx$

이제 정수 $k$를 일반적인 형상 모수(Shape parameter) $\alpha$로 바꾸고, $(k-1)!$을 $\Gamma(\alpha)$로 대체하면 감마 분포의 최종 수식이 완성됩니다.

$$f(t; \alpha, \lambda) = \frac{\lambda^\alpha t^{\alpha-1} e^{-\lambda t}} {\Gamma(\alpha)} \quad (t > 0)$$

  • $\alpha$ (알파): 형상 모수 (사건의 횟수 $k$에 해당)
  • $\lambda$ (람다): 척도 모수 혹은 비율 모수 (사건 발생률 $\beta$로 쓰기도 함)

4. 감마 분포 그래프의 이해

감마 분포는 $\alpha$(사건 횟수)가 커질수록 그래프의 모양이 어떻게 변할까요?

  1. $\alpha = 1$ (지수 분포): 첫 번째 사건을 기다리는 것이므로, $0$일 때 확률이 가장 높고 급격히 감소합니다.
  2. $\alpha$가 커질수록: $k$번째 사건을 기다리려면 당연히 시간이 어느 정도 흘러야 합니다. 따라서 $0$ 근처의 확률은 낮아지고, 그래프의 정점(Peak)이 오른쪽으로 이동하며 종 모양(정규 분포)에 가까워집니다. (중심극한정리)

5. 핵심 요약 및 성질

  1. 지수 분포와의 관계: 감마 분포에서 $\alpha=1$을 대입하면 지수 분포가 됩니다.
        $$f(t) = \frac{\lambda^1 t^0 e^{-\lambda t}}{\Gamma(1)} = \lambda e^{-\lambda t}$$
  2. 의미: 서로 독립적인 지수 분포를 따르는 확률 변수 $X_1, X_2, ..., X_k$의 합($T = X_1 + ... + X_k$)은 감마 분포를 따릅니다.
  3. 평균과 분산:
    • 평균($E[T]$): $k \times \frac{1}{\lambda} = \frac{\alpha}{\lambda}$ (지수 분포 평균의 $k$배)
    • 분산($Var[T]$): $k \times \frac{1}{\lambda^2} = \frac{\alpha}{\lambda^2}$

이로써 사건 발생 횟수(푸아송), 첫 사건 대기 시간(지수), $k$번째 사건 대기 시간(감마)의 연결 고리가 완성되었습니다.