מטריצות כמפות לינאריות

גאומטריה ואלגברה של העתקות לינאריות, וקטורים ומטריצות

מטריצה היא יותר מרשת מספרים. היא פונקציה שמשנה מרחב: האכל אותה וקטור x והיא מחזירה וקטור חדש Ax. על פני כל המישור היא פועלת כתנועה אחת קוהרנטית (סיבוב, מתיחה, השתקפות, גזירה, הטלה) המופעלת על כל נקודה בו זמנית.

מה שהופך אותה ללינארית הוא שהיא מכבדת את שתי פעולות הוקטור: A(x + y) = Ax + Ay ו־A(cx) = c·Ax. קווים ישרים נשארים ישרים, הראשית נשארת במקום, ורשתות מרווחות באופן שווה ממופות לרשתות מרווחות באופן שווה (אולי מוטות).

כך קוראים מטריצה בעין: העמודות שלה הן היכן וקטורי הבסיס נוחתים. העמודה הראשונה היא התמונה של [1, 0]; העמודה השנייה היא התמונה של [0, 1]. ברגע שיודעים לאן שני הצירים הולכים, כל הטרנספורמציה קבועה, כי כל וקטור אחר הוא צירוף שלהם.

איפה זה ב־MLמטריצת המשקלים W של רשת עצבית היא בדיוק זו: מפה לינארית שמעצבת מחדש את מרחב האקטיבציה לפני שהאי־לינאריות פועלת. כל שכבה מסובבת, מותחת, ומטילה את הקלט שלה למערכת קואורדינטות חדשה שבה עבודת השכבה הבאה קלה יותר. "ללמוד שכבה" אומר ללמוד לאן לשלוח את הצירים, כלומר ללמוד את העמודות של W.
▶ מטריצות כמפות לינאריות
← תלות לינארית ובסיסכפל מטריצות →