A matemática da incerteza
Dada uma conjunta p(x, y), supõe que só te interessa X e queres esquecer Y. O que fazes é marginalizar: somar (ou integrar) a conjunta sobre todos os valores da variável que não queres. O que sobra é a distribuição marginal de X por si só.
O nome vem das antigas tabelas de probabilidade: somava-se cada linha e escrevia-se o total na margem. Essas somas das linhas são a marginal de uma das variáveis, e as somas das colunas são a marginal da outra. Marginalizar significa "integrar e fazer desaparecer a variável que não nos interessa".
Pegue nessa tabela de dupla entrada de altura–peso e suponha que apenas se preocupa com a altura, ignorando completamente o peso. Simplesmente soma cada linha da conjunta p(x, y) e anota o total na margem — esse total da linha é a frequência com que cada altura ocorre, não importa o peso. Ler apenas esses totais na margem dá a distribuição marginal de X, a variável vista por si só.