Inferenza, stima e processo decisionale dai dati
Un valore di centro ti dice dove stanno i dati; la dispersione ti dice quanto oscillano attorno a quel centro. Due insiemi di dati possono avere la stessa media ed essere radicalmente diversi: uno strettamente concentrato, l'altro sparpagliato ovunque. La dispersione è ciò che li distingue.
Lo strumento principale è la varianza: la distanza quadratica media dalla media. La sua radice quadrata, la deviazione standard, è espressa nelle stesse unità dei dati, quindi è più facile da interpretare.
Due classi affrontano lo stesso quiz ed entrambe hanno una media di 72, quindi sulla carta sembrano identiche. Ma la classe A ha ottenuto 70, 72, 74 (tutti raggruppati) mentre la classe B ha ottenuto 50, 72, 94 (molto sparsi). Stesso centro, storie completamente diverse: la dispersione è esattamente il numero che le distingue.