Konsantrasyon Eşitsizlikleri (kısa)

Inference, estimation, and decision-making from data

Şimdiye kadar istatistik çoğunlukla ortalamalar ve asimptotiklerle ilgiliydi. Konsantrasyon eşitsizlikleri daha keskin, sonlu örnekli bir soru sorar: rastgele bir niceliğin ortalamasından çok uzağa düşme olasılığı nedir? Cevapları, makine öğrenmesinin neden hiç garanti sunabildiğinin matematiksel omurgasıdır.

Yalnızca negatif olmayan bir değişken ve ortalamasını gerektiren en temel eşitsizlik Markov eşitsizliğidir:

Negatif olmayan bir değişkenin ortalamasının çok katı olan değerlere sık sık çıkamayacağını söyler. Ortalama küçükse büyük değerler nadir olmak zorundadır. Kabadır, ama neredeyse hiçbir şey istemez.

Bunun ML'deki yeriHoeffding sınırı genelleme teorisinin kalbidir: bir modelin sonlu bir test setinde ölçülen hatasının gerçek hatasına yüksek olasılıkla yakın olduğunu kanıtlamasının nedeni budur; test skoruna güvenmenin biçimsel gerekçesi. Bu, PAC öğrenmenin ("Probably Approximately Correct") motorudur: yeterli örnekle, eğitim ve gerçek performans arasındaki fark yüksek olasılıkla küçüktür. Konsantrasyon…

▶ Konsantrasyon Eşitsizlikleri (kısa)

← Expectation-Maximization (EM)