Inference, estimation, and decision-making from data
Bir regresyon uydurmak kolay kısımdır. Daha zor soru ona güvenip güvenemeyeceğinizdir. Model tanılama, sayılara uyan ama altındaki varsayımları ihlal eden bir modeli yakalayan kontrollerdir. Bakılacak en yararlı nesne artıktır: e = y − ŷ, modelin açıklayamadığı arta kalan.
Model doğruysa, artıklar saf gürültü gibi görünmelidir: desen yok, sabit yayılım, kabaca simetrik. Ana araç bir artık grafiğidir: y ekseninde artıklar, x ekseninde uydurulmuş değerlere (veya bir girdiye) karşı. Orada olmaması gereken yapıyı arıyorsunuz.
İyi bir doktor hastalığı isimlendirmekle yetinmez; tedaviden sonra hangi semptomların kaldığını kontrol eder. Bir hastanın hala inatçı bir öksürüğü varsa, teşhis bir şeyi atlamış demektir. Kalıntılar bir modelin arta kalan belirtileridir: verilerin uyarlanmış çizginin açıklayamadığı kısmı. Zararsız rastgele gürültü yerine açık bir desen gösteriyorlarsa, model de bir şeyi kaçırmış demektir.