Inférence, estimation et prise de décision à partir des données
Le test t s'appuie sur une hypothèse : les données sont à peu près normales. Quand cela échoue (petits échantillons, asymétrie évidente, queues lourdes, données ordinales) les tests non paramétriques entrent en jeu. Ils ne font presque aucune hypothèse sur la forme de la distribution, généralement en travaillant avec les rangs au lieu des valeurs brutes.
Deux incontournables. Le test de Wilcoxon des rangs signés est la contrepartie non paramétrique du test t apparié (paires appariées). Le test U de Mann–Whitney est la contrepartie du test t à deux échantillons (deux groupes indépendants). Tous deux demandent « celles-ci ont-elles tendance à être plus grandes ? » sans supposer la normalité.
Imaginez juger une course à pied quand le chronomètre est cassé. Vous ne pouvez pas lire les temps exacts d'arrivée, mais vous pouvez toujours voir qui a franchi la ligne en premier, deuxième, et troisième. Cet ordre d'arrivée, les rangs, suffit pour déclarer un vainqueur, et peu importe si les temps étaient espacés de 10 secondes ou de 10 minutes. Les tests non paramétriques fonctionnent de la même manière : ils remplacent les valeurs brutes par des rangs, de sorte que quelques valeurs aberrantes extrêmes ou une distribution asymétrique ne peuvent pas fausser le verdict.