Rozkłady łączne

Matematyka niepewności

Do tej pory każda zmienna losowa żyła osobno. Ciekawe pytania dotyczą jednak zależności: wzrostu i wagi, obrazu i jego etykiety. Rozkład łączny p(x, y) podaje prawdopodobieństwo każdej pary wartości naraz. To pełny opis tego, jak dwie (lub więcej) zmienne zachowują się razem.

Dla zmiennych dyskretnych wyobraź sobie tabelę: wiersze to wartości X, kolumny to wartości Y, a każda komórka zawiera prawdopodobieństwo tej kombinacji. Wszystkie komórki są nieujemne i sumują się do 1 — znowu aksjomaty, tym razem w dwóch wymiarach. Dla zmiennych ciągłych mamy gęstość f(x, y), a prawdopodobieństwa są objętościami pod powierzchnią 2-D.

Wyobraź sobie dwuwymiarową tabelę ludzi posegregowanych jednocześnie według wzrostu i wagi: niski-i-lekki w jednej komórce, wysoki-i-ciężki w innej, oraz liczbę w każdej komórce mówiącą, jak częste jest to połączenie. Cała ta siatka połączeń to rozkład łączny p(x, y) — opisuje wzrost i wagę razem, a nie pojedynczo. Wypełnij każdą komórkę, upewnij się, że są nieujemne i sumują się do 1, a uchwycisz pełen obraz tego, jak te dwie cechy współgrają ze sobą.

Gdzie to występuje w MLUczenie nadzorowane skupia się w głównej mierze na modelowaniu rozkładu łącznego p(x, y) cech wejściowych oraz przypisanych do nich etykiet (bądź jego pewnego skrawka). Architektury generatywne dążą na ogół do tego, aby w jak największym stopniu zrekonstruować ów surowy nośnik informacji, czyli wyznaczyć sam w swej istocie rozkład gęstości prawdopodobieństwa p(x, y) dla generowania m.in. nowych…

▶ Rozkłady łączne

← Wielowymiarowy Gauss Rozkłady brzegowe →