Yayılım Ölçüleri

Inference, estimation, and decision-making from data

Bir merkez sana verinin nerede oturduğunu söyler; yayılım ise o merkezin etrafında ne kadar oynadığını söyler. İki veri kümesi aynı ortalamayı paylaşıp yine de çılgınca farklı olabilir: biri sıkıca kümelenmiş, diğeri her yere dağılmış. Yayılım işte bu farktır.

Beygir at varyanstır: ortalamadan olan karesel uzaklığın ortalaması. Onun karekökü olan standart sapma, veriyle aynı birimde yaşar, bu yüzden yorumlanması daha kolaydır.

İki sınıf aynı sınava girer ve ikisinin de ortalaması 72'dir, bu yüzden kağıt üzerinde tamamen aynı görünürler. Ancak A sınıfı 70, 72, 74 alırken (herkes birbirine yakın) B sınıfı 50, 72, 94 aldı (geniş çapta dağılmış). Aynı merkez, tamamen farklı hikayeler: yayılım, onları birbirinden ayıran sayıdır.

Bunun ML'deki yeriYayılım ML güvenilirliğinde her yerdedir. Bir mini-yığın boyunca gradyan varyansı, her eğitim adımının ne kadar gürültülü olduğunu denetler; yüksek varyans titrek bir iniş demektir. Ve bir modelin doğruluğunu bildirdiğinde, bir "+%0.3" iyileşmenin gerçek mi yoksa salt gürültü mü olduğunu sana söyleyen şey rastgele tohumlar boyunca standart sapmadır. Yayılımı olmayan bir sonuç, yarım bir sonuçtur.
▶ Yayılım Ölçüleri
← Merkez ÖlçüleriVerinin Dağılımları →