Linearkombinationen und Spanne

Geometrie und Algebra von linearen Abbildungen, Vektoren und Matrizen

Nimm dir ein paar Vektoren und zwei Operationen: skaliere jeden (multipliziere ihn mit einer beliebigen Zahl) und addiere die Ergebnisse. Jeder Vektor, den du auf diese Weise bauen kannst, ist eine Linearkombination deiner Ausgangsmenge. Die vollständige Sammlung von allem, was erreichbar ist, nennt man die Spanne (lineare Hülle).

Die Spanne ist hier der zentrale Gedanke, also stelle sie dir bildlich vor. Ein einziger, von null verschiedener Vektor, der in jede beliebige Richtung skaliert wird, zeichnet eine Gerade durch den Nullpunkt. Zwei Vektoren, die in wirklich verschiedene Richtungen weisen, zeichnen eine ganze Ebene aus. Füge einen dritten hinzu, der aus dieser Ebene herausragt, und du füllst den gesamten 3-D-Raum.

Fülle deinen Mixer mit zwei Grundzutaten — sagen wir einem Bananen-Pfeil und einem Beeren-Pfeil. Ein Smoothie ist jede Mischung, bei der du jede Basis skalierst (mehr oder weniger davon) und sie zusammengießt; das ist eine Linearkombination. Das vollständige Menü jedes Smoothies, den du möglicherweise aus diesen Basen mixen könntest, ist ihr span — und wenn beide Basen in wirklich unterschiedliche Richtungen ziehen, füllt dieses Menü die gesamte Ebene der Geschmacksrichtungen.

Wo das im ML vorkommtDie Spanne ist genau das, "was eine Schicht ausdrücken kann." Eine lineare Schicht Wx kann nur Ausgaben in der Spanne der Spalten von W erzeugen, ihrem Spaltenraum. Wenn dieser Spanne eine Richtung fehlt, die deine Daten benötigen, kann keine Wahl der Eingabe sie wiederherstellen; die Schicht ist strukturell blind für diese Richtung. Architekturen mit ausreichender Breite zu wählen heißt zum…
▶ Linearkombinationen und Spanne
← NormenLineare Unabhängigkeit und Basis →