Cálculo multivariável a partir dos primeiros princípios
O cálculo de uma variável vivia sobre uma reta. O machine learning, não. Os pesos de uma rede neural, um embedding, um gradiente: cada um é um ponto num espaço de alta dimensão, Rⁿ. A boa notícia é que a geometria que você conhece do plano R² se transfere quase palavra por palavra. Um vetor continua sendo uma seta a partir da origem; comprimento, ângulo e "sombra sobre outro vetor" continuam fazendo sentido. Só deixamos de conseguir desenhá-lo.
Um vetor v = (v₁, v₂, …, vₙ) é uma lista ordenada de números. Você pode lê-lo de duas maneiras ao mesmo tempo: como uma localização (o ponto onde você chega) e como uma direção com um comprimento (a seta que leva você até lá). Ambas as leituras são constantemente úteis em ML.
A norma (comprimento) de um vetor vem direto de Pitágoras, apenas com mais termos: