Distribuições Discretas Chave

A matemática da incerteza

Um punhado de distribuições com nome próprio cobre a maioria das situações discretas em ML. Cada uma é uma PMF pronta, com média e variância conhecidas, de modo que recorres à mais adequada em vez de voltares a derivar do zero.

A Bernoulli(p) modela um ensaio com dois resultados: sucesso (1) com probabilidade p e fracasso (0) com probabilidade 1−p. É o bloco de construção a partir do qual todas as outras distribuições discretas são feitas.

Duas contagens do dia a dia exibem as principais distribuições. Lance uma moeda 10 vezes e registe as caras: essa contagem é Binomial, uma soma de 10 ensaios sim/não independentes. Agora conte as chamadas telefónicas que um serviço de apoio recebe numa hora: essa contagem é Poisson, a lei para eventos raros espalhados pelo tempo, com uma única taxa λ que atua como a sua média e a sua variância.

Onde isto aparece no MLQuando escolhes uma loss de classificação, estás, na verdade, a escolher uma destas distribuições. A entropia cruzada binária é a log-verosimilhança negativa de uma Bernoulli: avalia a probabilidade única de um modelo em relação a um rótulo 0/1. A entropia cruzada multiclasse é a log-verosimilhança negativa de uma Categórica, a saída softmax avaliada em relação a um rótulo one-hot. A loss que…

▶ Distribuições Discretas Chave

← Variância PDF & CDF →