De wiskunde van onzekerheid
De Gaussische (normale) verdeling duikt vaker op dan elke andere in machine learning. Het is de gladde, symmetrische klok die je krijgt wanneer veel kleine onafhankelijke effecten bij elkaar optellen. Twee getallen leggen haar volledig vast: het gemiddelde μ (waar de piek zit) en de variantie σ² (hoe breed de klok is).
De formule heeft minder bewegende delen dan ze lijkt. De kern is exp(−(x−μ)²/2σ²): afstand tot het gemiddelde, gekwadrateerd, negatief gemaakt, zodat de dichtheid snel afneemt naarmate je verder van μ beweegt. De rommel ervoor is alleen de constante die de oppervlakte gelijk aan 1 maakt.
Sleep μ om de klok naar links/rechts te schuiven en σ om haar breder of scherper te maken. Een kleine σ geeft een hoge, zelfverzekerde piek; een grote σ spreidt het geloof dun over een breed bereik.