Inferentie, schatting en besluitvorming uit data
Een centrum vertelt je waar de data zich bevindt; spreiding vertelt je hoeveel het wiebelt rond dat centrum. Twee datasets kunnen hetzelfde gemiddelde delen en toch enorm verschillen: de ene strak geclusterd, de andere overal. Spreiding is het verschil.
Het werkpaard is de variantie: de gemiddelde gekwadrateerde afstand tot het gemiddelde. De vierkantswortel ervan, de standaardafwijking, leeft in dezelfde eenheden als de data, dus is hij makkelijker te interpreteren.
Twee klassen maken dezelfde quiz en beide scoren gemiddeld 72, dus op papier zien ze er identiek uit. Maar klasse A scoorde 70, 72, 74 (iedereen dicht bij elkaar) terwijl klasse B 50, 72, 94 scoorde (wijd verspreid). Hetzelfde middelpunt, compleet andere verhalen: spreiding is precies het getal dat hen onderscheidt.