גאומטריה ואלגברה של העתקות לינאריות, וקטורים ומטריצות
הטלה עונה על השאלה "מהי הנקודה הקרובה ביותר ל־b ששוכנת בתת־מרחב נתון?" דמיין נקודה המרחפת מעל רצפה: ההטלה שלה היא הנקודה על הרצפה ישירות מתחתיה, כף רגל האנך. זהו הקירוב הטוב ביותר של b הזמין בתוך תת־המרחב.
כדי להטיל וקטור b על כיוון יחיד a, הכפל את a בכמות שבה b שוכן לאורכו (מכפלה סקלרית), מנורמלת באורך בריבוע של a עצמו:
גרור את b באיור וצפה בצל שלו מחליק לאורך הקו a, נוחת תמיד בנקודה הקרובה ביותר, כשקטע השגיאה המקווקו פוגש את הקו בזווית ישרה.
איפה זה ב־MLהטלה היא הגאומטריה שמאחורי מנגנון תשומת הלב והזרמים השיוריים. רגרסיית ריבועים פחותים מטילה יעדים על מרחב העמודות של המודל. הזרם השיורי ב־transformer נקרא ונכתב שוב ושוב באמצעות הטלות, ואורתוגונליזציה בסגנון גרם־שמידט שומרת על כיוונים נלמדים נבדלים. "הנקודה הקרובה ביותר בתת־מרחב" הוא מהלך שמודלים מבצעים כל הזמן.