Matrizes como Aplicações Lineares

Geometria e álgebra das aplicações lineares, vetores e matrizes

Uma matriz é mais do que uma grelha de números. É uma função que transforma o espaço: dá-lhe um vetor x e ela devolve um novo vetor Ax. Em todo o plano, ela atua como um movimento coerente (uma rotação, um esticamento, uma reflexão, um cisalhamento, uma projeção) aplicado a todos os pontos de uma só vez.

O que a torna linear é o facto de respeitar as duas operações vetoriais: A(x + y) = Ax + Ay e A(cx) = c·Ax. As retas continuam retas, a origem mantém-se fixa, e grelhas uniformemente espaçadas são levadas em grelhas uniformemente espaçadas (possivelmente inclinadas).

Eis como ler uma matriz a olho: as suas colunas indicam onde os vetores da base vão pousar. A primeira coluna é a imagem de [1, 0]; a segunda coluna é a imagem de [0, 1]. Assim que sabes para onde vão os dois eixos, toda a transformação fica determinada, porque todo o outro vetor é combinação deles.

Onde isto aparece no MLA matriz de pesos W de uma rede neural é exatamente isto: uma aplicação linear que remodela o espaço de ativações antes de a não-linearidade atuar. Cada camada roda, estica e projeta a sua entrada num novo sistema de coordenadas onde o trabalho da camada seguinte fica mais fácil. "Aprender uma camada" significa aprender para onde enviar os eixos, isto é, aprender as colunas de W.
▶ Matrizes como Aplicações Lineares
← Independência Linear & BaseMultiplicação de Matrizes →