Test Non Parametrici

Inferenza, stima e processo decisionale dai dati

Il t-test poggia su un'assunzione: i dati sono approssimativamente normali. Quando questa cade (campioni piccoli, asimmetria evidente, code pesanti, dati ordinali) entrano in gioco i test non parametrici. Non fanno quasi nessuna assunzione sulla forma della distribuzione e di solito lavorano con i ranghi anziché con i valori grezzi.

Due pilastri. Il test dei ranghi con segno di Wilcoxon è la controparte non parametrica del t-test appaiato (coppie appaiate). Il test U di Mann–Whitney è la controparte del t-test a due campioni (due gruppi indipendenti). Entrambi si chiedono "questi valori tendono a essere più grandi?" senza assumere la normalità.

Immagina di giudicare una corsa a piedi quando il cronometro è rotto. Non puoi leggere i tempi di arrivo esatti, ma puoi ancora vedere chi ha tagliato il traguardo per primo, secondo e terzo. Quell'ordine di arrivo, i ranghi, è sufficiente per dichiarare un vincitore, e non importa se i tempi fossero separati da 10 secondi o da 10 minuti. I test non parametrici funzionano allo stesso modo: sostituiscono i valori grezzi con i ranghi, quindi alcuni valori anomali selvaggi o una distribuzione asimmetrica non possono distorcere il verdetto.

Dove si trova nel MLQuando si confrontano le accuratezze di più modelli, i punteggi sono spesso una manciata di numeri non normali, perfetti per i test non parametrici. I test di permutazione in particolare sono prediletti nell'ML perché non fanno praticamente nessuna assunzione e si adattano a qualunque statistica test ti interessi, comprese strane metriche personalizzate. Sono robusti proprio là dove il t-test…

▶ Test Non Parametrici

← Test Multipli Regressione Lineare Semplice →