Multiplicação de Matrizes

Geometria e álgebra de aplicações lineares, vetores e matrizes

A multiplicação de matrizes parece uma regra trabalhosa, mas o seu significado é claro: AB é a composição de duas transformações. Aplique B primeiro e depois A. O produto é a matriz única que realiza ambos os movimentos de uma só vez.

Para calcular uma entrada de AB, tome uma linha de A e faça o produto escalar com uma coluna de B. A entrada (i, j) é a linha i de A multiplicada escalarmente pela coluna j de B. É este o algoritmo inteiro: produtos escalares, dispostos numa grade.

Imagine duas máquinas em uma linha de fábrica. A primeira máquina B remodela uma peça, depois a segunda máquina A a remodela novamente. O produto AB é a única máquina combinada que faz as duas etapas em uma única passagem — e a ordem na linha é fixa, já que a peça deve passar por B antes de A.

Onde isso aparece no MLCompor camadas é multiplicação de matrizes. Uma pilha linear de duas camadas W₂(W₁x) iguala (W₂W₁)x; as camadas se fundem numa única aplicação. Na atenção, as pontuações vêm de um produto QKᵀ e a saída resulta de multiplicar esses pesos por V. Toda a passagem direta é uma cadeia destes produtos, e a regra de formato é precisamente o que as GPU foram construídas para processar.
▶ Multiplicação de Matrizes
← Matrizes como Aplicações LinearesTransposta →