تشخيص النموذج

الاستدلال والتقدير واتخاذ القرار من البيانات

ملاءمة الانحدار هي الجزء السهل. السؤال الأصعب هو ما إذا كان يمكنك الوثوق به. تشخيصات النموذج هي الفحوص التي تكشف نموذجاً يلائم الأرقام لكنه ينتهك الافتراضات التي تحته. وأكثر شيء مفيد للنظر إليه هو الباقي: e = y − ŷ، أي ما تبقّى ولم يستطع النموذج تفسيره.

إذا كان النموذج صحيحاً، فينبغي أن تبدو البواقي مثل ضوضاء صرفة: لا نمط، تشتّت ثابت، متماثلة تقريباً. والأداة الرئيسية هي مخطّط البواقي: البواقي على المحور الرأسي مقابل القيم المُلائمة (أو أحد المُدخلات) على المحور الأفقي. أنت تصطاد بنيةً ينبغي ألّا تكون هناك.

الطبيب الجيد لا يتوقف عند تسمية المرض؛ بل إنه يتحقق من الأعراض المتبقية بعد العلاج. إذا كان المريض لا يزال يعاني من سعال عنيد، فإن التشخيص قد أغفل شيئًا ما. البواقي هي الأعراض المتبقية للنموذج: ذلك الجزء من البيانات الذي لم يستطع الخط المُطابَق تفسيره. إذا كانت تُظهر نمطًا واضحًا بدلاً من ضوضاء عشوائية غير ضارة، فإن النموذج قد أغفل شيئًا أيضًا.

أين يظهر هذا في تعلّم الآلةتحليل البواقي هو السلف الإحصائي لـ منحنى التعلّم وتحليل الأخطاء في ML. «خسارة التدريب ≠ خسارة التحقق» تشخيص: تشير الفجوة الكبيرة إلى فرط الملاءمة (تباين عالٍ)، تماماً كما تشير البواقي ذات النمط إلى نموذج مُحدَّد بشكل خاطئ. تقطيع أخطائك حسب المجموعة الفرعية للعثور على المواضع التي يفشل فيها النموذج بشكل منهجي هو بالضبط تفكير مخطّط البواقي، لكن على نطاق أوسع.
▶ تشخيص النموذج
← الانحدار الخطي المتعددالانحدار المُنظَّم →