Inferenza, stima e processo decisionale dai dati
Un singolo valore di centro e una singola dispersione sono soltanto due numeri. La forma completa dei dati (la loro distribuzione) racconta molto di più. Il modo più rapido per vederla è un istogramma: si divide l'intervallo in classi e si conta quanti valori cadono in ciascuna. La sua versione lisciata è un grafico di densità.
Una volta vista la forma, contano due domande: la distribuzione è simmetrica o asimmetrica, e le sue code sono pesanti o leggere?
L'asimmetria (skewness) misura quanto la distribuzione si discosta dalla simmetria. Una distribuzione asimmetrica a destra (positiva) ha una lunga coda che si estende verso destra: redditi, tempi di attesa, dimensioni dei file. Una asimmetrica a sinistra trascina la coda verso sinistra. In una forma asimmetrica a destra, la media sta a destra della mediana, tirata via dalla coda.