Model Tanılama

Inference, estimation, and decision-making from data

Bir regresyon uydurmak kolay kısımdır. Daha zor soru ona güvenip güvenemeyeceğinizdir. Model tanılama, sayılara uyan ama altındaki varsayımları ihlal eden bir modeli yakalayan kontrollerdir. Bakılacak en yararlı nesne artıktır: e = y − ŷ, modelin açıklayamadığı arta kalan.

Model doğruysa, artıklar saf gürültü gibi görünmelidir: desen yok, sabit yayılım, kabaca simetrik. Ana araç bir artık grafiğidir: y ekseninde artıklar, x ekseninde uydurulmuş değerlere (veya bir girdiye) karşı. Orada olmaması gereken yapıyı arıyorsunuz.

İyi bir doktor hastalığı isimlendirmekle yetinmez; tedaviden sonra hangi semptomların kaldığını kontrol eder. Bir hastanın hala inatçı bir öksürüğü varsa, teşhis bir şeyi atlamış demektir. Kalıntılar bir modelin arta kalan belirtileridir: verilerin uyarlanmış çizginin açıklayamadığı kısmı. Zararsız rastgele gürültü yerine açık bir desen gösteriyorlarsa, model de bir şeyi kaçırmış demektir.

Bunun ML'deki yeriArtık analizi, ML'deki öğrenme eğrisi ve hata analizinin istatistiksel atasıdır. "Eğitim kaybı ≠ doğrulama kaybı" bir tanıdır: büyük bir fark, tıpkı desenli artıkların yanlış belirtilmiş bir modeli işaret etmesi gibi, aşırı uyumu (yüksek varyans) işaret eder. Hatalarınızı modelin sistematik olarak başarısız olduğu yeri bulmak için alt gruba göre dilimlemek, tam olarak büyütülmüş artık grafiği…

▶ Model Tanılama

← Çoklu Doğrusal Regresyon Düzenlileştirilmiş Regresyon →