Kansdichtheid & cumulatieve verdeling

De wiskunde van onzekerheid

Voor continue grootheden zoals een lengte, een gewicht of een pixelintensiteit is het vragen naar P(X = 3.0000…) hopeloos: er zijn oneindig veel waarden, dus elke afzonderlijke heeft kans nul. In plaats daarvan beschrijven we hoe de kans verspreid is met een kansdichtheidsfunctie f(x), en lezen we kansen af als oppervlakten.

Een dichtheid is zelf geen kans, en kan groter zijn dan 1. Wat moet gelden is dat ze niet-negatief is en dat de totale oppervlakte 1 is, de continue echo van "de kansmassafunctie sommeert tot 1":

Sleep μ en σ hierboven: de kromme verschuift en rekt uit, maar de oppervlakte eronder blijft altijd precies 1. De kans op een interval is het stuk oppervlakte dat erboven ligt.

Waar dit voorkomt in MLDe uitvoer van een generatief model p(x | θ) is een dichtheid. Om uit een 1-D-verdeling te trekken kun je inverse-transform-sampling gebruiken: trek een uniforme u ∈ [0,1] en geef F⁻¹(u) terug, door de cumulatieve verdeling te inverteren. Normalizing flows veralgemenen precies dit idee, door een inverteerbare afbeelding te leren waarvan de transformatieregel een eenvoudige dichtheid in een…

▶ Kansdichtheid & cumulatieve verdeling

← Belangrijke Discrete Verdelingen Verwachting & variantie (continu) →