Producto Punto

Geometría y álgebra de aplicaciones lineales, vectores y matrices

El producto punto toma dos vectores y devuelve un solo número. La receta es simple: multiplica los componentes correspondientes y suma los resultados. Esa aritmética básica tiene un significado geométrico. El producto punto mide cuánto apuntan en la misma dirección.

La forma de derecha es la que hay que usar. |a| y |b| son las longitudes, y θ es el ángulo entre los flechas. Entonces, el signo del producto punto revela la geometría al instante: positivo significa que las flechas apuntan en la misma dirección (θ < 90°), negativo significa que se oponen (θ > 90°), y exactamente cero significa que son perpendiculares. Ese último caso aparece una y otra vez.

Imagina empujar un carrito de compras mientras sopla el viento. El producto escalar de tu empuje y el viento te dice qué tan alineadas están las dos flechas: es grande y positive cuando el viento te ayuda a avanzar, zero cuando el viento sopla directamente a través de tu camino sin hacer trabajo, y negativo cuando te empuja hacia atrás. Leído como una puntuación de similitud, un producto escalar más grande simplemente significa "estas dos flechas concuerdan más".

Dónde aparece en el MLCuando un transformador decide a qué token anterior prestar atención, calcula un producto punto. Una puntuación de atención es q · kentre un vector de consulta y uno de clave: alta cuando apuntan en la misma dirección, lo que significa "este token es relevante para ese otro." Similitud coseno es la misma idea con las longitudes divididas. Clasifica cuán similares son dos embebidos sin importar el…
▶ Producto Punto
← Vectores en RⁿNormas →