Testes Não-Paramétricos

Inferência, estimação e tomada de decisão a partir de dados

O teste t se apoia numa suposição: a de que os dados são aproximadamente normais. Quando essa suposição falha (amostras pequenas, assimetria evidente, caudas pesadas, dados ordinais), entram em cena os testes não-paramétricos. Eles praticamente não fazem suposições sobre a forma da distribuição, trabalhando geralmente com ordens (postos) em vez dos valores brutos.

Há dois clássicos. O teste de Wilcoxon dos postos com sinal é o equivalente não-paramétrico do teste t pareado (pares correspondentes). O teste U de Mann–Whitney é o equivalente do teste t para duas amostras (dois grupos independentes). Ambos perguntam "estes valores tendem a ser maiores?" sem pressupor normalidade.

Imagine julgar uma corrida a pé quando o cronômetro está quebrado. Você não pode ler os tempos exatos de chegada, mas ainda pode ver quem cruzou a linha de chegada em primeiro, segundo e terceiro. Essa ordem de chegada, as classificações (ranks), é suficiente para declarar um vencedor, e não importa se os tempos tinham 10 segundos ou 10 minutos de diferença. Testes não-paramétricos funcionam da mesma maneira: eles substituem valores brutos por classificações, de modo que alguns pontos fora da curva selvagens ou uma distribuição assimétrica não possam distorcer o veredicto.

Onde isso aparece no MLAo comparar a acurácia de modelos, as pontuações são muitas vezes um punhado de números não-normais — terreno perfeito para os testes não-paramétricos. Os testes de permutação, em particular, são uma escolha favorita em ML porque praticamente não fazem suposições e se adaptam a qualquer estatística de teste que você queira, incluindo métricas personalizadas pouco habituais. São robustos…

▶ Testes Não-Paramétricos

← Testes Múltiplos Regressão Linear Simples →