t-toets

Inferentie, schatting en besluitvorming uit data

De t-toets is het werkpaard voor het vergelijken van gemiddelden. Ze beantwoordt vragen als "verschilt dit gemiddelde van een doelwaarde?" of "verschillen de gemiddelden van deze twee groepen?", met een toetsingsgrootheid die de kloof tussen gemiddelden meet in eenheden van standaardfout.

Voor het eensteekproefgeval (is het gemiddelde μ gelijk aan een doelwaarde μ₀?) is de grootheid:

De teller is "hoe ver ligt het steekproefgemiddelde van de doelwaarde?"; de noemer is de standaardfout. Een grote |t| betekent dat de kloof groot is ten opzichte van de ruis, wat bewijs tegen H₀ is.

Waar dit voorkomt in MLDe gepaarde t-toets is het juiste gereedschap voor "is model A significant beter dan model B?" wanneer beide op dezelfde voorbeelden geëvalueerd worden. Paren op elke testinstantie heft de moeilijkheidsvariatie van voorbeeld tot voorbeeld op, en isoleert zo het modelverschil. Pas op: standaard CV-folds overlappen, wat onafhankelijkheid schendt, en gecorrigeerde gepaarde toetsen bestaan precies…
▶ t-toets
← p-waardenMeervoudig Toetsen →