Wnioskowanie, estymacja i podejmowanie decyzji z danych
Miara środka mówi nam, gdzie skupione są dane, natomiast miara rozproszenia określa, jak bardzo odchylają się one od tego środka. Dwa zbiory mogą mieć tę samą średnią, a mimo to diametralnie się od siebie różnić: jeden może być ciasno skupiony, a drugi mocno rozproszony. Rozproszenie ma w takich przypadkach kluczowe znaczenie.
Podstawową miarą rozproszenia jest wariancja: średnia arytmetyczna kwadratów odchyleń od średniej. Jej pierwiastek kwadratowy, czyli odchylenie standardowe, jest wyrażone w tych samych jednostkach co oryginalne dane, co sprawia, że jest ono znacznie łatwiejsze do zinterpretowania.
Dwie klasy piszą ten sam quiz i obie osiągają średnią 72, więc na papierze wyglądają identycznie. Jednak klasa A zdobyła 70, 72, 74 (wszyscy skupieni blisko siebie), podczas gdy klasa B zdobyła 50, 72, 94 (szeroko rozproszone). Ten sam środek, zupełnie inne historie: rozrzut jest dokładnie tą liczbą, która pozwala je odróżnić.