Verinin Dağılımları

Inference, estimation, and decision-making from data

Tek bir merkez ve tek bir yayılım yalnızca iki sayıdır. Verinin tam şekli (dağılımı) çok daha fazlasını taşır. Onu görmenin en hızlı yolu bir histogramdır: aralığı kutulara böl ve her birine kaç değer düştüğünü say. Pürüzsüzleştirilmiş bir sürümü yoğunluk grafiğidir.

Şekli görebildiğinde iki soru önem kazanır: simetrik mi yoksa çarpık mı ve kuyrukları ağır mı yoksa hafif mi?

Çarpıklık asimetriyi ölçer. Sağa çarpık (pozitif) bir dağılımın sağa doğru uzanan uzun bir kuyruğu vardır: gelirler, bekleme süreleri, dosya boyutları. Sola çarpık olan ise sola doğru uzanır. Sağa çarpık bir şekilde ortalama medyanın sağında oturur, kuyruk tarafından dışarı çekilmiştir.

Bunun ML'deki yeriDağılım şekli gerçek ML kararlarını yönlendirir. Bir ağın içindeki aktivasyon dağılımları kayabilir ve ağır kuyruklar geliştirebilir; batch/layer normalizasyonunun var olma nedeni budur. Yığınlar boyunca kayıp dağılımları, modelinin her yerde tekdüze mi başarısız olduğunu yoksa zor örneklerden oluşan ağır kuyruklu bir azınlıkta mı tıkandığını ortaya koyar. Ve ağır kuyruklar, sağlam kayıpların…
▶ Verinin Dağılımları
← Yayılım ÖlçüleriDeğişkenler Arası İlişkiler →