Vettori e Geometria di Rⁿ

Calcolo multivariabile dai primi principi

Il calcolo a una variabile viveva su una retta. Il machine learning no. I pesi di una rete neurale, un embedding, un gradiente: ciascuno è un punto in uno spazio ad alta dimensione, Rⁿ. La buona notizia è che la geometria che conosci dal piano piatto R² si trasporta quasi parola per parola. Un vettore è ancora una freccia dall'origine; lunghezza, angolo, e "ombra su un altro vettore" hanno ancora senso. Semplicemente smettiamo di poterlo disegnare.

Un vettore v = (v₁, v₂, …, vₙ) è una lista ordinata di numeri. Puoi leggerlo in due modi contemporaneamente: come una posizione (il punto in cui atterri) e come una direzione con una lunghezza (la freccia che ci arriva). Entrambe le letture contano costantemente nell'ML.

La norma (lunghezza) di un vettore viene dritta da Pitagora, solo con più termini:

Dove si trova nel MLQuando un transformer decide quanto un token dovrebbe fare attenzione a un altro, prende il prodotto scalare di una query e una key, q·k. È la stessa operazione che classificare i nearest neighbour in uno spazio di embedding per cosine similarity, e la stessa che un classificatore lineare usa per chiedere da che parte di w·x + b = 0 atterra un punto. Gran parte di ciò che nell'ML viene chiamato…
▶ Vettori e Geometria di Rⁿ
← Forme QuadraticheFunzioni f: Rⁿ → R →