Multiplicación de matrices

Geometría y álgebra de aplicaciones lineales, vectores y matrices

La multiplicación de matrices parece una regla complicada, pero su significado es claro: AB es la composición de dos transformaciones. Haz B primero, luego A. El producto es la única matriz que logra ambas movidas en un solo paso.

Para calcular una entrada de AB, toma una fila de A y dótala con una columna de B. La entrada (i, j) es la fila i de A dótada con la columna j de B. Eso es todo el algoritmo: productos escalares, dispuestos en una cuadrícula.

Imagina dos máquinas en una línea de fábrica. La primera máquina B remodela una pieza, luego la segunda máquina A la remodela de nuevo. El producto AB es la única máquina combinada que realiza ambos pasos en una sola pasada — y el orden en la línea es fijo, ya que la pieza debe pasar por B antes que por A.

Dónde aparece en el MLComponer capas es multiplicación matricial. Una pila lineal de dos capas W₂(W₁x) es igual a (W₂W₁)x; las capas se fusionan en un solo mapa. En atención, los puntajes vienen de un producto QKᵀ y la salida viene de multiplicar esos pesos por V. Cada paso hacia adelante es una cadena de estos productos, y la regla de forma es lo que hacen los GPUs.
▶ Multiplicación de matrices
← Matrices como transformaciones linealesTranspuesta →