Matematyka niepewności
Do tej pory każda zmienna losowa żyła osobno. Ciekawe pytania dotyczą jednak zależności: wzrostu i wagi, obrazu i jego etykiety. Rozkład łączny p(x, y) podaje prawdopodobieństwo każdej pary wartości naraz. To pełny opis tego, jak dwie (lub więcej) zmienne zachowują się razem.
Dla zmiennych dyskretnych wyobraź sobie tabelę: wiersze to wartości X, kolumny to wartości Y, a każda komórka zawiera prawdopodobieństwo tej kombinacji. Wszystkie komórki są nieujemne i sumują się do 1 — znowu aksjomaty, tym razem w dwóch wymiarach. Dla zmiennych ciągłych mamy gęstość f(x, y), a prawdopodobieństwa są objętościami pod powierzchnią 2-D.
Wyobraź sobie dwuwymiarową tabelę ludzi posegregowanych jednocześnie według wzrostu i wagi: niski-i-lekki w jednej komórce, wysoki-i-ciężki w innej, oraz liczbę w każdej komórce mówiącą, jak częste jest to połączenie. Cała ta siatka połączeń to rozkład łączny p(x, y) — opisuje wzrost i wagę razem, a nie pojedynczo. Wypełnij każdą komórkę, upewnij się, że są nieujemne i sumują się do 1, a uchwycisz pełen obraz tego, jak te dwie cechy współgrają ze sobą.