확률 변수

불확실성의 수학

«앞면»이나 «세 번째로 뽑은 빨간 카드» 같은 결과는 그대로는 계산하기 어렵습니다. 확률 변수가 이 문제를 해결합니다. 각 결과에 숫자를 붙이는 규칙이지요. 형식적으로는 X: Ω → ℝ입니다. 동전 세 개를 던지고 X가 앞면의 개수를 세도록 정하면, 각 결과가 0, 1, 2, 3 중 하나로 대응되어 평균을 내거나 제곱하거나 합할 수 있게 됩니다.

카니발 룰렛이 색깔이 있는 쐐기 모양 구역에 멈출 때, 각 색상마다 다른 금액을 지불합니다. 즉, 모든 결과에 숫자가 붙어 있습니다. 그 숫자는 당신이 한 번 돌릴 때 얻는 상금인 확률 변수 X입니다. 각 상금이 나오는 빈도를 p(x) = P(X = x)로 나열하면, 당신이 얻을 상금의 전체 분포를 알 수 있습니다.

이산 확률 변수에 대해서는 확률 질량 함수 p(x) = P(X = x)가 각 값의 확률을 하나하나 나열합니다. 이 함수는 음이 아니고 지지집합 위에서 합이 1이 되는데, 이는 앞의 공리를 숫자의 언어로 다시 표현한 것입니다.

머신러닝에서의 위치레이블 Y도 확률 변수이고, 모델의 예측 역시 확률 변수입니다. softmax의 argmax, 즉 예측 클래스는 모델의 출력 분포를 하나의 인덱스로 대응시키는 확률 변수입니다. 언어 모델에서 샘플링이란 어휘 위의 PMF에서 확률 변수(다음 토큰)를 뽑는 일입니다.
▶ 확률 변수
← 독립기댓값 →