Matrices como transformaciones lineales

Geometría y álgebra de aplicaciones lineales, vectores y matrices

Una matriz es más que una cuadrícula de números. Es una función que transforma el espacio: dale un vector x y te devuelve un nuevo vector Ax. En todo el plano actúa como un movimiento coherente (una rotación, una estirada, una reflexión, una deformación, una proyección) aplicado a cada punto al mismo tiempo.

Lo que la hace lineal es que respeta las dos operaciones vectoriales: A(x + y) = Ax + Ay y A(cx) = c·Ax. Las líneas rectas permanecen rectas, el origen se mantiene en su lugar y las cuadrículas equidistantes se transforman en cuadrículas equidistantes (posiblemente inclinadas).

Aquí está cómo leer una matriz a simple vista: sus columnas muestran dónde terminan los vectores base. La primera columna es la imagen de [1, 0]; la segunda columna es la imagen de [0, 1]. Una vez que sabes adónde van los dos ejes, toda la transformación está fijada, porque cada otro vector es una combinación de ellos.

Dónde aparece en el MLLa matriz de pesos W de una red neuronal es exactamente esto: una transformación lineal que reconfigura el espacio de activación antes de que actúe la no linealidad. Cada capa rota, estira y proyecta su entrada en un nuevo sistema de coordenadas donde el trabajo de la siguiente capa es más fácil. "Aprender una capa" significa aprender dónde enviar los ejes, es decir, aprender las columnas de W.

▶ Matrices como transformaciones lineales

← Independencia Lineal y Base Multiplicación de matrices →