Diagonalizacja

Geometria i algebra odwzorowań liniowych, wektorów i macierzy

Diagonalizacja polega na przepisaniu macierzy do jej własnego, najbardziej naturalnego układu współrzędnych, zbudowanego z jej wektorów własnych. W tym układzie macierz ma postać diagonalną (przekątniową): nie robi nic poza skalowaniem każdej osi wektorowej o odpowiadającą jej wartość własną. Skomplikowane przekształcenie staje się niezwykle proste.

Macierz P zawiera wektory własne jako swoje kolumny, a macierz D jest diagonalna i zawiera wartości własne. Czytaj ten iloczyn od prawej do lewej jako trzyetapowy przepis: P⁻¹ obraca do układu współrzędnych wektorów własnych, D skaluje każdą z osi, a P obraca z powrotem. Złożona transformacja wyrażona po prostu jako czyste rozciąganie osadzone między dwiema zmianami perspektywy.

Diagonalizacja sprawia, że obliczanie potęg macierzy staje się praktycznie darmowe. Ponieważ środkowe pary P⁻¹P znoszą się nawzajem, Aᵏ = P Dᵏ P⁻¹, a podniesienie do potęgi macierzy diagonalnej sprowadza się do podniesienia każdego jej elementu na przekątnej do tej właśnie potęgi. Nie trzeba wielokrotnie mnożyć całej macierzy.

Gdzie to występuje w MLDiagonalizacja doskonale wyjaśnia długoterminowe zachowanie powtarzających się przekształceń liniowych, a praktycznie każdy algorytm iteracyjny jest właśnie wielokrotnie powtarzanym przekształceniem w pobliżu tzw. punktu stałego. To, czy dynamika trenowania modelu zbiegnie się gładko, czy wybuchnie (gradient explosion), zależy od tego, czy odpowiednie wartości własne znajdują się wewnątrz czy na…

▶ Diagonalizacja

← Wektory własne i wartości własne Macierze symetryczne →