Inférence, estimation et prise de décision à partir des données
Avant de modéliser les données, il faut les résumer honnêtement. Le résumé le plus basique est un seul nombre qui répond à « où les données sont-elles centrées ? » Il y a trois réponses classiques, et elles ne sont pas toujours d'accord, c'est exactement pourquoi vous devez connaître les trois.
La moyenne est le point d'équilibre : additionnez toutes les valeurs, divisez par leur nombre. La médiane est la valeur du milieu une fois triées. Le mode est simplement la valeur la plus fréquente.
Imaginez les prix de vente dans une petite rue, en centaines de milliers : 3, 4, 4, 5, 30. Quatre maisons ordinaires et un manoir au bord de l'eau. Le prix moyen est de 46/5 = 9.2, pourtant pas une seule maison ordinaire ne coûte près de cela. La médiane, la valeur du milieu une fois triée, est juste de 4 et reflète honnêtement la maison typique, car le manoir isolé ne peut pas tirer le milieu de la liste très loin.