2025/11/27 4

지수 분포 -> 감마 분포

지수 분포가 '첫 번째 사건'이 발생할 때까지의 시간이라면, 감마 분포(Gamma Distribution)는 이를 일반화하여 '$k$번째 사건'이 발생할 때까지의 시간을 모델링합니다. 지수 분포 유도 때와 마찬가지로 푸아송 과정(Poisson Process)을 기반으로 아주 직관적인 방법(미소 구간 확률)을 사용하여 유도할 수 있습니다.1. 목표 설정: 무엇을 구하는가?상황: 사건이 평균적으로 단위 시간당 $\lambda$회 발생하는 푸아송 과정.확률 변수 $T$: $k$번째 사건이 발생할 때까지 걸리는 시간.목표: $T$의 확률 밀도 함수(PDF) $f(t)$ 구하기.2. 직관적 유도 (미소 구간 접근법)확률 밀도 함수 $f(t)$의 정의를 생각해 봅시다. $f(t)dt$는 '정확히 시간 $t$ 시점에..

푸아송 분포 -> 지수 분포

지수 분포의 수식을 유도하는 가장 논리적이고 표준적인 방법은 푸아송 과정(Poisson Process)에서 출발하는 것입니다. 지수 분포는 '사건이 발생할 때까지 걸리는 시간'에 대한 분포이고, 푸아송 분포는 '특정 시간 동안 발생하는 사건의 횟수'에 대한 분포입니다. 이 둘은 동전의 양면과 같습니다. 이 관계를 이용하여 지수 분포의 확률 밀도 함수(PDF)인 $f(t) = \lambda e^{-\lambda t}$를 유도해 보겠습니다. 1. 전제 조건: 푸아송 분포단위 시간당 평균 $\lambda$번 발생하는 사건이 있다고 가정합니다. 시간 $t$ 동안 사건이 총 $k$번 발생할 확률 $P(N(t)=k)$는 푸아송 분포를 따르며 다음과 같습니다. $$P(N(t) = k) = \frac{(\lambda ..

이항분포 -> 푸아송 분포

푸아송 분포(Poisson Distribution)는 이항분포(Binomial Distribution)의 특수한 극한 형태로 유도하는 것이 가장 일반적이고 직관적입니다. 단위 시간(또는 단위 공간) 안에 어떤 사건이 몇 번 발생할 것인지를 표현하는 이 분포는, "시행 횟수($n$)는 무수히 많고, 발생 확률($p$)은 매우 희박할 때"의 확률 분포입니다. 다음은 이항분포에서 출발하여 푸아송 분포의 수식을 유도하는 단계별 과정입니다.1. 기본 설정: 이항분포에서 출발먼저, 확률 변수 $X$가 시행 횟수 $n$, 성공 확률 $p$인 이항분포를 따른다고 가정합니다.$$X \sim B(n, p)$$이때 $k$번 성공할 확률 질량 함수(PMF)는 다음과 같습니다.$$P(X=k) = \binom{n}{k} p^k ..

이항 분포에서 Non-IID까지: 확률 분포의 연결 고리와 응용

1) 이항 분포 -> 2) 푸아송 분포 -> 3) 지수 분포 -> 4) 감마 분포 -> 5) 디리클레 분포 -> 6) Non-IID 데이터 시뮬레이션 확률 분포들이 서로 어떻게 연결되어 있는지 이해하는 것은 통계적 모델링과 데이터 시뮬레이션, 특히 머신러닝의 데이터 분포를 이해하는 데 매우 중요합니다. 위 여섯 단계는 '이산(Discrete)에서 연속(Continuous)으로', 그리고 '단일 사건에서 다변량 비율(Multivariate Proportion)로' 확장되는 흐름을 가지고 있습니다. 이 문서에서는 각 단계의 핵심 개념과 수식적 관계, 그리고 마지막으로 이를 활용한 Non-IID 데이터 시뮬레이션까지 설명합니다.1. 이항 분포(Binomial) $\rightarrow$ 푸아송 분포(Poisso..