Macierze szczególne

Geometria i algebra odwzorowań liniowych, wektorów i macierzy

Kilka rodzajów macierzy pojawia się tak często i charakteryzuje tak przejrzystą geometrią, że doczekały się własnych nazw. Rozpoznawanie ich na pierwszy rzut oka oszczędza sporo wysiłku.

Macierz jednostkowa I ma jedynki na głównej przekątnej i zera poza nią. Jest to odwzorowanie tożsamościowe („nic nie rób”): Ix = x dla każdego wektora. Macierz diagonalna ma niezerowe elementy tylko na przekątnej; rozciąga ona każdą oś niezależnie, przy czym element dᵢ skaluje i-tą współrzędną bez jej mieszania z pozostałymi.

Pomyśl o mikserze dźwięku. Macierz jednostkowa I to każdy suwak ustawiony na 1: sygnał przechodzi nietknięty, dokładnie "nic nie robi". Macierz diagonalna to zestaw niezależnych suwaków głośności — każdy z nich niezależnie podbija lub obcina pojedynczy kanał, przy czym żaden kanał nigdy nie przenika do drugiego.

Gdzie to występuje w MLOdwzorowania ortogonalne pomagają utrzymać odpowiednią skalę sygnałów. Ortogonalna inicjalizacja wag konfiguruje początkowo warstwę jako odwzorowanie zachowujące długość, dzięki czemu aktywacje i gradienty nie wybuchają ani nie zanikają, przechodząc przez głęboki ciąg warstw. Macierze diagonalne ujawniają się jako operacje skalowania poszczególnych cech (np. w normalizacji wsadowej - batch…
▶ Macierze szczególne
← TranspozycjaAx = b: Geometria →