Inferência, estimação e tomada de decisão a partir de dados
O teste t apoia-se numa suposição: a de que os dados são aproximadamente normais. Quando essa suposição falha (amostras pequenas, assimetria evidente, caudas pesadas, dados ordinais), entram em cena os testes não-paramétricos. Praticamente não fazem suposições sobre a forma da distribuição, trabalhando geralmente com ordens (postos) em vez dos valores brutos.
Há dois clássicos. O teste de Wilcoxon dos postos com sinal é o equivalente não-paramétrico do teste t emparelhado (pares correspondentes). O teste U de Mann–Whitney é o equivalente do teste t para duas amostras (dois grupos independentes). Ambos perguntam "estes valores tendem a ser maiores?" sem pressupor normalidade.
Imagine julgar uma corrida a pé quando o cronómetro está avariado. Não consegue ler os tempos exatos de chegada, mas ainda consegue ver quem cortou a meta em primeiro, segundo e terceiro. Essa ordem de chegada, as classificações, é suficiente para declarar um vencedor, e não importa se os tempos estiveram separados por 10 segundos ou 10 minutos. Os testes não paramétricos funcionam da mesma forma: substituem valores brutos por classificações, de modo a que uns quantos valores atípicos extremos ou uma distribuição distorcida não consigam desvirtuar o veredicto.