Cálculo multivariable desde primeros principios
El cálculo de una variable vivía en una línea. El aprendizaje automático no lo hace. Las ponderaciones de una red neuronal, un embedding, un gradiente: cada uno es un punto en el espacio dimensional altoRⁿ. La buena noticia es que la geometría que conoces del plano llano R² se traslada casi palabra por palabra. Un vector sigue siendo una flecha desde el origen; longitud, ángulo y "sombra sobre otro vector" siguen teniendo sentido. Solo dejamos de poder dibujarlo.
Un vector v = (v₁, v₂, …, vₙ) es una lista ordenada de números. Puedes leerlo de dos maneras a la vez: como un lugar (el punto en el que aterrizas) y como una dirección con longitud (la flecha que te lleva allí). Ambos lecturas importan constantemente en ML.
La norma (longitud) de un vector viene directamente de Pitágoras, solo con más términos: