Matrizen als lineare Abbildungen

Geometrie und Algebra von linearen Abbildungen, Vektoren und Matrizen

Eine Matrix ist mehr als ein Gitter von Zahlen. Sie ist eine Funktion, die den Raum transformiert: Gib ihr einen Vektor x, und sie gibt dir einen neuen Vektor Ax zurück. Über die gesamte Ebene hinweg wirkt sie als eine einzige zusammenhängende Bewegung (eine Drehung, eine Streckung, eine Spiegelung, eine Scherung, eine Projektion), die auf jeden Punkt gleichzeitig angewendet wird.

Linear wird sie dadurch, dass sie die beiden Vektoroperationen respektiert: A(x + y) = Ax + Ay und A(cx) = c·Ax. Geraden bleiben gerade, der Nullpunkt bleibt an seinem Platz, und gleichmäßig angeordnete Gitter werden auf gleichmäßig angeordnete (eventuell geneigte) Gitter abgebildet.

So liest man eine Matrix mit bloßem Auge: Ihre Spalten zeigen, wo die Basisvektoren landen. Die erste Spalte ist das Bild von [1, 0], die zweite Spalte das Bild von [0, 1]. Sobald man weiß, wohin die beiden Achsen gehen, ist die gesamte Transformation festgelegt, denn jeder andere Vektor ist eine Kombination aus ihnen.

Wo das im ML vorkommtDie Gewichtsmatrix W eines neuronalen Netzes ist genau dies: eine lineare Abbildung, die den Aktivierungsraum verformt, bevor die Nichtlinearität wirkt. Jede Schicht dreht, streckt und projiziert ihre Eingabe in ein neues Koordinatensystem, in dem die nächste Schicht ihre Arbeit leichter hat. "Eine Schicht lernen" bedeutet zu lernen, wohin man die Achsen schicken soll, das heißt, die Spalten von…
▶ Matrizen als lineare Abbildungen
← Lineare Unabhängigkeit und BasisMatrixmultiplikation →