Inferenza, stima e processo decisionale dai dati
Il t-test poggia su un'assunzione: i dati sono approssimativamente normali. Quando questa cade (campioni piccoli, asimmetria evidente, code pesanti, dati ordinali) entrano in gioco i test non parametrici. Non fanno quasi nessuna assunzione sulla forma della distribuzione e di solito lavorano con i ranghi anziché con i valori grezzi.
Due pilastri. Il test dei ranghi con segno di Wilcoxon è la controparte non parametrica del t-test appaiato (coppie appaiate). Il test U di Mann–Whitney è la controparte del t-test a due campioni (due gruppi indipendenti). Entrambi si chiedono "questi valori tendono a essere più grandi?" senza assumere la normalità.
Immagina di giudicare una corsa a piedi quando il cronometro è rotto. Non puoi leggere i tempi di arrivo esatti, ma puoi ancora vedere chi ha tagliato il traguardo per primo, secondo e terzo. Quell'ordine di arrivo, i ranghi, è sufficiente per dichiarare un vincitore, e non importa se i tempi fossero separati da 10 secondi o da 10 minuti. I test non parametrici funzionano allo stesso modo: sostituiscono i valori grezzi con i ranghi, quindi alcuni valori anomali selvaggi o una distribuzione asimmetrica non possono distorcere il verdetto.