Vectores y geometría de Rⁿ

Cálculo multivariable desde primeros principios

El cálculo de una variable vivía en una línea. El aprendizaje automático no lo hace. Las ponderaciones de una red neuronal, un embedding, un gradiente: cada uno es un punto en el espacio dimensional altoRⁿ. La buena noticia es que la geometría que conoces del plano llano R² se traslada casi palabra por palabra. Un vector sigue siendo una flecha desde el origen; longitud, ángulo y "sombra sobre otro vector" siguen teniendo sentido. Solo dejamos de poder dibujarlo.

Un vector v = (v₁, v₂, …, vₙ) es una lista ordenada de números. Puedes leerlo de dos maneras a la vez: como un lugar (el punto en el que aterrizas) y como una dirección con longitud (la flecha que te lleva allí). Ambos lecturas importan constantemente en ML.

La norma (longitud) de un vector viene directamente de Pitágoras, solo con más términos:

Dónde aparece en el MLCuando un transformer decide cuánto debe prestar atención una token a otra, toma el producto escalar de una consulta y una clave, q·k. Eso es la misma operación que clasificar vecinos más cercanos en un espacio embedding por similitud coseno, y la misma que usa un clasificador lineal para preguntar a qué lado de w·x + b = 0 cae un punto. La mayoría de lo que se llama 'similitud' en ML es este…
▶ Vectores y geometría de Rⁿ
← Formas CuadráticasFunciones f: Rⁿ → R →