الاستدلال والتقدير واتخاذ القرار من البيانات
لا يمكنك الحكم على نموذج بخطأ تدريبه؛ فقد رأى تلك البيانات بالفعل، فيستطيع الغش بحفظها. تحتاج إلى خطئه على بيانات لم يرها قط. لكن حجز مجموعة اختبار واحدة يُهدر بيانات ويُعطي تقديرًا ذا ضوضاء. يحلّ التحقق المتقاطع كلتا المشكلتين.
في التحقق المتقاطع بـ k طيّات، قسّم البيانات إلى k طيّات متساوية. درّب على k−1 منها، وتحقّق على المحجوزة، ودوِّر بحيث تخدم كل طيّة بوصفها مجموعة التحقق مرّة واحدة بالضبط. خُذ متوسط أخطاء التحقق الـ k للحصول على تقدير مستقرّ لمدى تعميم النموذج.
التحقق المتقاطع (Cross-validation) يشبه أداء عدة امتحانات تجريبية للتنبؤ بدرجتك في الامتحان الحقيقي. إذا قمت فقط بتصحيح إجاباتك على الأسئلة التي حفظت إجاباتها بالفعل، فسوف تبالغ في التقدير بشكل كبير، لذا يجب عليك تخصيص مجموعة جديدة من الأسئلة في كل مرة، وتقييم نفسك بناءً عليها، وتقوم بتدوير المجموعة التي تم حجبها. يمنحك حساب متوسط درجاتك عبر جميع الجلسات التجريبية تنبؤًا أكثر ثباتًا بكثير لكيفية أدائك في ذلك اليوم مقارنةً بأي امتحان تجريبي واحد.