Матрицы как линейные отображения

Геометрия и алгебра линейных отображений, векторов и матриц

Матрица — больше, чем сетка чисел. Это функция, преобразующая пространство: подайте вектор x, и она возвращает новый вектор Ax. На всей плоскости она действует как одно согласованное движение (поворот, растяжение, отражение, сдвиг, проекция), применённое к каждой точке сразу.

Что делает его линейным — уважение к двум векторным операциям: A(x + y) = Ax + Ay и A(cx) = c·Ax. Прямые остаются прямыми, начало координат остаётся на месте, и равномерные сетки переходят в равномерные (возможно, наклонённые) сетки.

Вот как читать матрицу на глаз: её столбцы — куда попадают базисные векторы. Первый столбец — образ [1, 0]; второй — образ [0, 1]. Зная, куда уходят две оси, вы фиксируете всё преобразование, потому что любой другой вектор — их комбинация.

Где это встречается в MLМатрица весов W нейросети — именно это: линейное отображение, перестраивающее пространство активаций перед нелинейностью. Каждый слой поворачивает, растягивает и проецирует вход в новую систему координат, где следующему слою легче. «Обучить слой» значит узнать, куда отправить оси, то есть узнать столбцы W.
▶ Матрицы как линейные отображения
← Линейная независимость и базисУмножение матриц →