אנטרופיה צולבת

המתמטיקה של אי־ודאות

נניח שהאמת היא התפלגות p, אך אתה מקודד את התוצאות בעזרת מודל אחר q. אנטרופיה צולבת היא ההפתעה הממוצעת שאתה משלם בפועל: ההפתעה נמדדת לפי המודל q, אבל ממוצעת לפי תדירות ההתרחשות האמיתית של האירועים תחת p:

היא מתפצלת לשני רכיבים בעלי משמעות: אנטרופיית האמת הבלתי־נמנעת, ובתוספת קנס על השימוש במודל הלא־נכון, הוא התבדרות KL (השיעור הבא):

מאחר ש־H(p) נקבע על ידי הנתונים, מזעור האנטרופיה הצולבת על פני המודל זהה למזעור התבדרות KL, ובכך דוחף את q לעבר p. האנטרופיה הצולבת היא תמיד לפחות H(p), עם שוויון רק כאשר q = p.

איפה זה ב־MLפתח כמעט כל מסווג או מודל שפה, והשכבה האחרונה תהיה softmax ואחריה הפסד אנטרופיה צולבת. מזעורו הוא בדיוק אמידת נראות מרבית: −log q(אמיתי), מסוכם על פני הנתונים, הוא הנראות הלוגריתמית השלילית. אימון רשת לחיזוי הטוקן הבא הוא מזעור האנטרופיה הצולבת בין התפלגות הטוקן הבא האמיתית לבין זו של המודל.
▶ אנטרופיה צולבת
← אנטרופיההתבדרות KL →