Multiplicação de Matrizes

Geometria e álgebra das aplicações lineares, vetores e matrizes

A multiplicação de matrizes parece uma regra trabalhosa, mas o seu significado é claro: AB é a composição de duas transformações. Aplica B primeiro e depois A. O produto é a matriz única que realiza ambos os movimentos de uma só vez.

Para calcular uma entrada de AB, toma uma linha de A e faz o produto escalar com uma coluna de B. A entrada (i, j) é a linha i de A multiplicada escalarmente pela coluna j de B. É este o algoritmo inteiro: produtos escalares, dispostos numa grelha.

Imagine duas máquinas numa linha de fábrica. A primeira máquina B remodela uma peça, depois a segunda máquina A remodela-a novamente. O produto AB é a única máquina combinada que faz ambos os passos numa só passagem — e a ordem na linha é fixa, uma vez que a peça deve passar por B antes de A.

Onde isto aparece no MLCompor camadas é multiplicação de matrizes. Uma pilha linear de duas camadas W₂(W₁x) iguala (W₂W₁)x; as camadas fundem-se numa única aplicação. Na atenção, as pontuações vêm de um produto QKᵀ e a saída resulta de multiplicar esses pesos por V. Toda a passagem direta é uma cadeia destes produtos, e a regra de formato é precisamente o que as GPU foram construídas para processar.
▶ Multiplicação de Matrizes
← Matrizes como Aplicações LinearesTransposta →