지수 분포가 '첫 번째 사건'이 발생할 때까지의 시간이라면, 감마 분포(Gamma Distribution)는 이를 일반화하여 '$k$번째 사건'이 발생할 때까지의 시간을 모델링합니다.
지수 분포 유도 때와 마찬가지로 푸아송 과정(Poisson Process)을 기반으로 아주 직관적인 방법(미소 구간 확률)을 사용하여 유도할 수 있습니다.
1. 목표 설정: 무엇을 구하는가?
- 상황: 사건이 평균적으로 단위 시간당 $\lambda$회 발생하는 푸아송 과정.
- 확률 변수 $T$: $k$번째 사건이 발생할 때까지 걸리는 시간.
- 목표: $T$의 확률 밀도 함수(PDF) $f(t)$ 구하기.
2. 직관적 유도 (미소 구간 접근법)
확률 밀도 함수 $f(t)$의 정의를 생각해 봅시다. $f(t)dt$는 '정확히 시간 $t$ 시점에($t$와 $t+dt$ 사이) $k$번째 사건이 발생할 확률'입니다.
이 상황이 발생하려면 다음 두 가지 조건이 동시에 충족되어야 합니다.
- 조건 A: 시간 $0$부터 $t$까지 정확히 $k-1$번의 사건이 이미 발생해 있어야 합니다.
- 조건 B: 아주 짧은 시간 $dt$ 동안 정확히 1번의 사건이 발생해야 합니다(이것이 $k$번째 사건이 됨).
이를 수식으로 옮겨보겠습니다.
단계 1: 조건 A의 확률 (푸아송 분포)
시간 $t$ 동안 사건이 $k-1$번 발생할 확률은 푸아송 확률 공식에 $n=k-1$을 대입하면 됩니다.
$$P(A) = \frac{e^{-\lambda t}(\lambda t)^{k-1}}{(k-1)!}$$
단계 2: 조건 B의 확률 (사건 발생률)
매우 짧은 시간 $dt$ 동안 사건이 발생할 확률은 발생률 $\lambda$에 비례합니다. (지수 분포의 성질이자 푸아송 과정의 정의)
$$P(B) \approx \lambda dt$$
단계 3: 결합 (PDF 완성)
두 사건은 독립적이므로 확률을 곱합니다.
$$f(t)dt \approx P(A) \times P(B)$$
$$f(t)dt = \left( \frac{e^{-\lambda t}(\lambda t)^{k-1}}{(k-1)!} \right) \times (\lambda dt)$$
양변의 $dt$를 약분하고 정리하면, $k$번째 사건이 발생할 때까지의 대기 시간 분포인 얼랑 분포(Erlang Distribution)의 PDF가 나옵니다. (얼랑 분포는 감마 분포의 정수 버전입니다.)
$$f(t) = \frac{\lambda (\lambda t)^{k-1} e^{-\lambda t}}{(k-1)!} = \frac{\lambda^k t^{k-1} e^{-\lambda t}}{(k-1)!}$$
3. 일반화: 팩토리얼에서 감마 함수로
위의 식은 $k$가 '1번째, 2번째...'처럼 정수(Integer)일 때만 유효합니다. 이를 실수(Real number) 범위까지 확장하기 위해 수학적 도구를 바꿉니다.
- 팩토리얼의 일반화: $(k-1)!$은 정수에서만 정의되지만, 이를 실수 $\alpha$로 확장한 것이 감마 함수 $\Gamma(\alpha)$입니다.
- $\Gamma(k) = (k-1)!$ (단, $k$는 정수)
- $\Gamma(\alpha) = \int_{0}^{\infty} x^{\alpha-1} e^{-x} dx$
이제 정수 $k$를 일반적인 형상 모수(Shape parameter) $\alpha$로 바꾸고, $(k-1)!$을 $\Gamma(\alpha)$로 대체하면 감마 분포의 최종 수식이 완성됩니다.
$$f(t; \alpha, \lambda) = \frac{\lambda^\alpha t^{\alpha-1} e^{-\lambda t}} {\Gamma(\alpha)} \quad (t > 0)$$
- $\alpha$ (알파): 형상 모수 (사건의 횟수 $k$에 해당)
- $\lambda$ (람다): 척도 모수 혹은 비율 모수 (사건 발생률 $\beta$로 쓰기도 함)
4. 감마 분포 그래프의 이해
감마 분포는 $\alpha$(사건 횟수)가 커질수록 그래프의 모양이 어떻게 변할까요?
- $\alpha = 1$ (지수 분포): 첫 번째 사건을 기다리는 것이므로, $0$일 때 확률이 가장 높고 급격히 감소합니다.
- $\alpha$가 커질수록: $k$번째 사건을 기다리려면 당연히 시간이 어느 정도 흘러야 합니다. 따라서 $0$ 근처의 확률은 낮아지고, 그래프의 정점(Peak)이 오른쪽으로 이동하며 종 모양(정규 분포)에 가까워집니다. (중심극한정리)
5. 핵심 요약 및 성질
- 지수 분포와의 관계: 감마 분포에서 $\alpha=1$을 대입하면 지수 분포가 됩니다.
$$f(t) = \frac{\lambda^1 t^0 e^{-\lambda t}}{\Gamma(1)} = \lambda e^{-\lambda t}$$ - 의미: 서로 독립적인 지수 분포를 따르는 확률 변수 $X_1, X_2, ..., X_k$의 합($T = X_1 + ... + X_k$)은 감마 분포를 따릅니다.
- 평균과 분산:
- 평균($E[T]$): $k \times \frac{1}{\lambda} = \frac{\alpha}{\lambda}$ (지수 분포 평균의 $k$배)
- 분산($Var[T]$): $k \times \frac{1}{\lambda^2} = \frac{\alpha}{\lambda^2}$
이로써 사건 발생 횟수(푸아송), 첫 사건 대기 시간(지수), $k$번째 사건 대기 시간(감마)의 연결 고리가 완성되었습니다.
'수학 > 푸아송 과정과 확률 분포' 카테고리의 다른 글
| 지수 분포의 이해 (0) | 2025.11.28 |
|---|---|
| 감마 분포 -> 디리클레 분포 (0) | 2025.11.28 |
| 푸아송 분포 -> 지수 분포 (0) | 2025.11.27 |
| 이항분포 -> 푸아송 분포 (0) | 2025.11.27 |
| 이항 분포에서 Non-IID까지: 확률 분포의 연결 고리와 응용 (0) | 2025.11.27 |