PDF와 CDF

불확실성의 수학

키, 무게, 픽셀 강도처럼 연속적인 양에 대해서는 P(X = 3.0000…)를 묻는 것이 부질없습니다. 값이 무한히 많으므로 어느 한 값의 확률은 0이기 때문입니다. 그래서 대신 확률 밀도 함수 f(x)로 확률이 어떻게 퍼져 있는지 기술하고, 확률을 면적으로 읽습니다.

밀도 자체는 확률이 아니며 1을 넘을 수도 있습니다. 다만 두 조건은 반드시 만족해야 합니다. 음이 아니어야 하고, 전체 면적이 1이어야 합니다. 이는 «PMF의 합이 1»이라는 규칙의 연속판입니다:

위에서 μ와 σ를 드래그해 보세요. 곡선이 미끄러지듯 움직이고 늘어나거나 줄어들지만, 아래의 면적은 언제나 정확히 1입니다. 어떤 구간의 확률은 그 구간 위에 놓인 면적 조각입니다.

머신러닝에서의 위치생성 모델의 출력 p(x | θ)는 밀도입니다. 1차원 분포에서 샘플링하려면 역변환 샘플링을 씁니다. 균일분포에서 u ∈ [0,1]을 뽑고 F⁻¹(u)를 반환하여 CDF를 거꾸로 거슬러 올라가는 방식입니다. 정규화 플로우가 바로 이 아이디어를 일반화한 것으로, 변수 변환을 통해 단순한 밀도를 복잡한 밀도로 바꾸는 가역 사상을 학습합니다.

▶ PDF와 CDF

← 핵심 이산 분포 기댓값과 분산 (연속) →