Matrices comme Applications Linéaires

Géométrie et algèbre des applications linéaires, vecteurs et matrices

Une matrice est plus qu'une grille de nombres. C'est une fonction qui transforme l'espace : donnez-lui un vecteur x et elle vous rend un nouveau vecteur Ax. Sur tout le plan elle agit comme un mouvement cohérent (une rotation, un étirement, une réflexion, un cisaillement, une projection) appliqué à chaque point à la fois.

Ce qui la rend linéaire est qu'elle respecte les deux opérations vectorielles : A(x + y) = Ax + Ay et A(cx) = c·Ax. Les droites restent droites, l'origine reste fixe, et les grilles régulièrement espacées deviennent des grilles régulièrement espacées (possiblement inclinées).

Voici comment lire une matrice à l'œil : ses colonnes sont là où les vecteurs de base atterrissent. La première colonne est l'image de [1, 0] ; la seconde colonne est l'image de [0, 1]. Une fois que vous savez où les deux axes vont, toute la transformation est fixée, parce que tout autre vecteur est une combinaison d'eux.

Où cela apparaît en MLLa matrice de poids W d'un réseau de neurones est exactement ceci : une application linéaire qui reforme l'espace d'activation avant que la non-linéarité n'agisse. Chaque couche fait pivoter, étire, et projette son entrée dans un nouveau système de coordonnées où le travail de la couche suivante est plus facile. « Apprendre une couche » signifie apprendre où envoyer les axes, c.-à-d. apprendre…
▶ Matrices comme Applications Linéaires
← Indépendance Linéaire & BaseMultiplication Matricielle →