조건부 확률

불확실성의 수학

새로운 정보는 확률을 바꿉니다. "주사위가 짝수가 나왔다"는 것을 알게 되면, 그것이 2일 확률은 더 이상 1/6이 아닙니다. 홀수 면들을 배제했기 때문입니다. 조건부 확률은 어떤 사건 B가 이미 일어났음을 알 때 확률을 갱신하는 장치입니다.

P(A | B)를 "B가 주어졌을 때 A의 확률"로 읽습니다. 기하학적으로 이것은 확대-후-재정규화입니다. B 바깥의 모든 것을 버리고, B를 새로운 전체 세계로 취급한 뒤, 그 세계의 어느 정도가 A에도 속하는지를 묻습니다. P(B)로 나누면 축소된 세계의 총 확률이 여전히 1이 되도록 다시 스케일링됩니다.

방금 양성 판정이 나온 선별 검사를 상상해 보세요. 그 단서가 현실을 바꾸지는 않지만 가능성을 좁혀줍니다. 음성이 나온 사람들은 제외하고 양성이 나온 그룹 B만 살펴볼 수 있습니다. "내가 실제로 병에 걸렸을까?"라는 질문은 좁혀진 그룹 중 실제로 병에 걸린 사람의 비율인 P(A | B)가 됩니다.

머신러닝에서의 위치분류기는 조건부 확률을 계산합니다. 그 핵심 임무는 P(class | input), 즉 보고 있는 픽셀이나 토큰이 주어졌을 때 각 레이블의 확률입니다. 소프트맥스 벡터는 문자 그대로 P(y | x)입니다. 입력에 조건화하는 것이 클래스에 대한 사전 분포를 예측으로 바꾸는 것입니다.

▶ 조건부 확률

← 확률의 공리 베이즈 정리 →