Gęstość i dystrybuanta

Matematyka niepewności

W przypadku ciągłych zmiennych losowych — takich jak wzrost, waga czy intensywność piksela — pytanie o dokładne P(X = 3.0000…) traci sens. Mamy tu do czynienia z nieskończoną liczbą możliwych wartości, więc prawdopodobieństwo trafienia w jedną, konkretną z nich wynosi z definicji zero. Zamiast tego opisujemy sposób rozkładu tego prawdopodobieństwa za pomocą funkcji gęstości prawdopodobieństwa f(x), a samo prawdopodobieństwo odczytujemy interpretując je jako pole pod wykresem funkcji.

Gęstość sama w sobie nie jest prawdopodobieństwem i może śmiało przyjmować wartości przekraczające 1. To, co musi zostać bezwzględnie spełnione, to fakt jej nieujemności oraz to, że całkowite zsumowane pole pod krzywą gęstości musi wynosić równo 1 — to nic innego jak odpowiednik zasady „PMF sumuje się do 1" dla ciągłych przedziałów:

Za pomocą suwaków przesuń wartości μ oraz σ. Zauważ, że chociaż krzywa przemieszcza się i rozciąga, to pole pod nią niezmiennie zachowuje wartość 1. Prawdopodobieństwo dla danego przedziału wyznacza obszar zlokalizowany pod tą krzywą na odpowiednim wycinku osi.

Gdzie to występuje w MLWyjście modelu generatywnego p(x | θ) to ciągła funkcja gęstości. Jeśli chcesz z niej próbkować, możesz użyć metody odwracania dystrybuanty (inverse transform sampling): wystarczy wylosować zmienną jednostajną u ∈ [0,1] i przepuścić ją przez odwrotną dystrybuantę F⁻¹(u), aby otrzymać wynik z pożądanego rozkładu. Złożone modele Normalizing Flows opierają się na tej samej idei, używając ciągów…

▶ Gęstość i dystrybuanta

← Kluczowe rozkłady dyskretne Wartość oczekiwana i wariancja (ciągłe) →