Matrices als lineaire afbeeldingen

Meetkunde en algebra van lineaire afbeeldingen, vectoren en matrices

Een matrix is meer dan een raster van getallen. Het is een functie die de ruimte transformeert: voer haar een vector x en ze geeft een nieuwe vector Ax terug. Over het hele vlak werkt ze als één samenhangende beweging (een rotatie, een uitrekking, een spiegeling, een afschuiving, een projectie) die op elk punt tegelijk wordt toegepast.

Wat het lineair maakt is dat het de twee vectorbewerkingen respecteert: A(x + y) = Ax + Ay en A(cx) = c·Ax. Rechte lijnen blijven recht, de oorsprong blijft op zijn plaats, en gelijkmatig verdeelde rasters worden afgebeeld op gelijkmatig verdeelde (mogelijk scheve) rasters.

Zo lees je een matrix met het oog: zijn kolommen zijn waar de basisvectoren landen. De eerste kolom is het beeld van [1, 0]; de tweede kolom is het beeld van [0, 1]. Zodra je weet waar de twee assen heen gaan, ligt de hele transformatie vast, want elke andere vector is een combinatie ervan.

Waar dit voorkomt in MLEen neuraal netwerks gewichtsmatrix W is precies dit: een lineaire afbeelding die de activatieruimte hervormt voordat de niet-lineariteit inwerkt. Elke laag roteert, rekt uit en projecteert zijn invoer in een nieuw coördinatenstelsel waar de taak van de volgende laag makkelijker is. "Een laag leren" betekent leren waar de assen heen te sturen, dat wil zeggen, de kolommen van W leren.
▶ Matrices als lineaire afbeeldingen
← Lineaire onafhankelijkheid & basisMatrixvermenigvuldiging →