Niet-parametrische Toetsen

Inferentie, schatting en besluitvorming uit data

De t-toets leunt op een aanname: de gegevens zijn ruwweg normaal. Wanneer dat faalt (kleine steekproeven, duidelijke scheefheid, zware staarten, ordinale gegevens) springen niet-parametrische toetsen in. Ze maken bijna geen aanname over de vorm van de verdeling, meestal door met rangen te werken in plaats van met ruwe waarden.

Twee vaste waarden. De Wilcoxon-rangtekentoets is de niet-parametrische tegenhanger van de gepaarde t-toets (gematchte paren). De Mann–Whitney U-toets is de tegenhanger van de tweesteekproef-t-toets (twee onafhankelijke groepen). Beide vragen "neigen deze ertoe groter te zijn?" zonder normaliteit aan te nemen.

Stel je voor dat je een hardloopwedstrijd jureert terwijl de stopwatch kapot is. Je kunt geen exacte finishtijden aflezen, maar je kunt nog steeds zien wie als eerste, tweede en derde over de streep kwam. Die aankomstvolgorde, de rangen, is genoeg om een winnaar uit te roepen, en het maakt niet uit of de tijden 10 seconden of 10 minuten uit elkaar lagen. Non-parametrische toetsen werken op dezelfde manier: ze vervangen ruwe waarden door rangen, zodat een paar wilde uitschieters of een scheve verdeling het oordeel niet kunnen verstoren.

Waar dit voorkomt in MLBij het vergelijken van modelnauwkeurigheden zijn de scores vaak een handjevol niet-normale getallen, perfect voor niet-parametrische toetsen. Permutatietoetsen in het bijzonder zijn een favoriet voor ML omdat ze in wezen geen aannames maken en zich aanpassen aan elke toetsingsgrootheid die je wilt, inclusief vreemde aangepaste metrieken. Ze zijn robuust precies waar de t-toets nerveus wordt.

▶ Niet-parametrische Toetsen

← Meervoudig Toetsen Enkelvoudige Lineaire Regressie →