التحقق المتقاطع

الاستدلال والتقدير واتخاذ القرار من البيانات

لا يمكنك الحكم على نموذج بخطأ تدريبه؛ فقد رأى تلك البيانات بالفعل، فيستطيع الغش بحفظها. تحتاج إلى خطئه على بيانات لم يرها قط. لكن حجز مجموعة اختبار واحدة يُهدر بيانات ويُعطي تقديرًا ذا ضوضاء. يحلّ التحقق المتقاطع كلتا المشكلتين.

في التحقق المتقاطع بـ k طيّات، قسّم البيانات إلى k طيّات متساوية. درّب على k−1 منها، وتحقّق على المحجوزة، ودوِّر بحيث تخدم كل طيّة بوصفها مجموعة التحقق مرّة واحدة بالضبط. خُذ متوسط أخطاء التحقق الـ k للحصول على تقدير مستقرّ لمدى تعميم النموذج.

التحقق المتقاطع (Cross-validation) يشبه أداء عدة امتحانات تجريبية للتنبؤ بدرجتك في الامتحان الحقيقي. إذا قمت فقط بتصحيح إجاباتك على الأسئلة التي حفظت إجاباتها بالفعل، فسوف تبالغ في التقدير بشكل كبير، لذا يجب عليك تخصيص مجموعة جديدة من الأسئلة في كل مرة، وتقييم نفسك بناءً عليها، وتقوم بتدوير المجموعة التي تم حجبها. يمنحك حساب متوسط درجاتك عبر جميع الجلسات التجريبية تنبؤًا أكثر ثباتًا بكثير لكيفية أدائك في ذلك اليوم مقارنةً بأي امتحان تجريبي واحد.

أين يظهر هذا في تعلّم الآلةالتحقق المتقاطع هو كيف ينتقي ممارسو تعلّم الآلة النماذج وفرط المعاملات دون خداع أنفسهم. فهو يُقدّر خطأ التعميم (الكمية التي يدور حولها تفكيك الانحياز-التباين) مستخدمًا كل البيانات بكفاءة. وهو الخط الأمامي ضد تسريب البيانات: الخلل الصامت الذي تتسلّل فيه معلومات من توزيع الاختبار إلى التدريب فتُنتج نتائج تحقق رائعة ومزيّفة تمامًا.
▶ التحقق المتقاطع
← تفكيك الانحياز-التباينمقاييس التقييم →