Prawdopodobieństwo warunkowe

Matematyka niepewności

Nowe informacje zmieniają szanse. Gdy dowiadujesz się, że „na kostce wypadła liczba parzysta", szansa wyrzucenia 2 nie wynosi już 1/6, ponieważ wykluczyłeś nieparzyste ścianki. Prawdopodobieństwo warunkowe to mechanizm aktualizowania prawdopodobieństwa, gdy wiesz, że pewne zdarzenie B już zaszło.

Czytaj P(A | B) jako „prawdopodobieństwo A pod warunkiem B." Geometrycznie to proces przybliżenia i renormalizacji: odrzuć wszystko poza B, traktuj B jako nowy, kompletny wszechświat i zapytaj, jaki ułamek tego świata stanowi A. Dzielenie przez P(B) odpowiednio to skaluje, aby ten zmniejszony świat nadal miał całkowite prawdopodobieństwo równe 1.

Wyobraź sobie badanie przesiewowe, które właśnie dało wynik dodatni. Ta wskazówka nie zmienia rzeczywistości, ale zawęża możliwości: możesz odrzucić każdego, kogo test był ujemny, i patrzeć tylko na grupę z wynikiem dodatnim B. Pytanie "czy faktycznie mam tę chorobę?" staje się P(A | B), czyli ułamkiem tej zawężonej grupy, który jest naprawdę chory.

Gdzie to występuje w MLKlasyfikator oblicza prawdopodobieństwo warunkowe. Jego zadaniem jest wyznaczenie P(class | input), czyli prawdopodobieństwa przypisania do danej klasy pod warunkiem obserwowanych pikseli lub tokenów. Wektor wyjściowy warstwy softmax to dosłownie P(y | x). To właśnie uwarunkowanie od wejścia przekształca rozkład a priori klas w predykcję.

▶ Prawdopodobieństwo warunkowe

← Aksjomaty prawdopodobieństwa Twierdzenie Bayesa →