Belangrijke Discrete Verdelingen

De wiskunde van onzekerheid

Een handvol benoemde verdelingen dekt de meeste discrete situaties in ML. Elke is een kant-en-klare KMF met bekend gemiddelde en variantie, zodat je naar de juiste grijpt in plaats van vanaf nul opnieuw af te leiden.

Bernoulli(p) modelleert één proef met twee uitkomsten: succes (1) met kans p, mislukking (0) met kans 1−p. Het is de bouwsteen waaruit elke andere discrete verdeling is gemaakt.

Twee alledaagse tellingen demonstreren de bekendste verdelingen. Gooi 10 keer een munt op en turf het aantal keer kop: die telling is Binomiaal, een som van 10 onafhankelijke ja/nee experimenten. Tel nu de telefoongesprekken die een helpdesk in één uur ontvangt: die telling is Poisson, de wet voor zeldzame gebeurtenissen verspreid over tijd, met één enkel tempo λ dat tevens fungeert als zowel zijn gemiddelde als zijn variantie.

Waar dit voorkomt in MLWanneer je een classificatieverlies kiest, kies je eigenlijk een van deze verdelingen. Binaire cross-entropie is de negatieve log-aannemelijkheid van een Bernoulli: het scoort de enkele kans van een model tegen een 0/1-label. Multi-klasse cross-entropie is de negatieve log-aannemelijkheid van een Categorische, de softmax-uitvoer gescoord tegen een one-hot-label. Het verlies dat je kiest codeert…
▶ Belangrijke Discrete Verdelingen
← VariantieKansdichtheid & cumulatieve verdeling →