Parametreler ve Tahminciler

Inference, estimation, and decision-making from data

Neredeyse her istatistiksel sorunun aynı biçimi vardır. Dünyada göremediğin gerçek bir sayı vardır, parametre θ (gerçek bir ortalama, gerçek bir başarı olasılığı). Elinde yalnızca sonlu bir veri örneklemi var. O veriden bir tahmin hesaplarsın, tahminci θ̂. Tahmin, iyi tahminler kurma ve onlara ne kadar güvenileceğini bilme sanatıdır.

Veri rastgele olduğundan, θ̂ de kendisi rastgele bir niceliktir: deneyi yeniden yap, farklı bir θ̂ elde et. Bir tahminciyi iki şeye göre yargılarız: yanlılığı (ortalamada θ'ya konuyor mu?) ve varyansı (örneklemden örnekleme ne kadar zıplıyor?).

Baharatını değerlendirmek için tüm tencere çorbayı içemezsiniz, bu yüzden iyice karıştırır ve bir kaşık tadarsınız. Tüm tencerenin gerçek tuzluluğu doğrudan göremediğiniz parametre θ'dır; kaşığınızın tuzluluğu tahmin edici θ̂'dır. Önce iyice karıştırırsanız tek bir kaşık tüm tencereyi oldukça iyi tahmin eder — bu karıştırma, örneği temsil edici kılan şeydir.

Bunun ML'deki yeriEksik uyum ile aşırı uyum aynı ödünleşimdir. Bir modelin parametreleri θ̂'dır, sonlu eğitim verisinden uydurulmuştur. Eksik uyum = yüksek yanlılık: model gerçeği yakalayamayacak kadar basittir. Aşırı uyum = yüksek varyans: model o kadar esnektir ki belirli eğitim örneklemini ezberler, ve yeni bir örneklem çılgınca farklı parametreler verirdi. Model karmaşıklığını seçmek, bu ödünleşimde bir nokta…
▶ Parametreler ve Tahminciler
← Değişkenler Arası İlişkilerMaksimum Olabilirlik Tahmini →