קרוס־ולידציה — סטטיסטיקה · Mathematics for Machine Learning

אי אפשר לשפוט מודל לפי שגיאת האימון שלו; הוא כבר ראה את הנתונים האלה, ולכן הוא יכול לרמות באמצעות שינון. אתה צריך את שגיאתו על נתונים שמעולם לא ראה. אבל הפרשת מערך מבחן יחיד מבזבזת נתונים ונותנת אומדן רועש. קרוס־ולידציה פותרת את שתי הבעיות.

בקרוס־ולידציה k-fold, מחלקים את הנתונים ל־k קיפולים שווים. מאמנים על k−1 מהם, מבצעים ולידציה על הקיפול שהופרש, ומסובבים כך שכל קיפול משמש כמערך ולידציה בדיוק פעם אחת. ממצעים את k שגיאות הולידציה כדי לקבל אומדן יציב לכך שהמודל מכליל.

אימות-צולב הוא כמו לשבת למספר בחינות תרגול כדי לחזות את הציון שלכם בבחינה האמיתית. אם הייתם מעריכים את עצמכם רק על שאלות שכבר שיננתם את התשובות להן, הייתם נותנים הערכת-יתר פראית, לכן אתם מניחים בצד מקבץ רענן של שאלות בכל פעם, בודקים את עצמכם עליהן, ומסובבים איזה מקבץ מוחזק בצד. מיצוע הציונים שלכם על פני כל ישיבות התרגול נותן תחזית הרבה יותר יציבה לגבי איך תצליחו ביום עצמו מכל בחינת מתכונת בודדת.

איפה זה ב־MLקרוס־ולידציה היא הדרך שבה מתרגלי ML בוחרים מודלים והיפר־פרמטרים בלי לרמות את עצמם. היא אומדת את שגיאת ההכללה (הכמות שבה עוסק פירוק הטיה־שונות) תוך שימוש יעיל בכל הנתונים. והיא קו ההגנה הראשון מפני דליפת נתונים: הבאג השקט שבו מידע מהתפלגות המבחן מתגנב לאימון ומייצר ציוני ולידציה יפהפיים ומזויפים לחלוטין.