Vectoren & meetkunde van Rⁿ

Meervariabelecalculus vanuit eerste principes

Calculus van één variabele leefde op een lijn. Machine learning niet. De gewichten van een neuraal netwerk, een embedding, een gradiënt: elk is een punt in een hoogdimensionale ruimte, Rⁿ. Het goede nieuws is dat de meetkunde die je kent van het platte vlak R² bijna woord voor woord overdraagt. Een vector is nog steeds een pijl vanuit de oorsprong; lengte, hoek en "schaduw op een andere vector" hebben allemaal nog betekenis. We kunnen het alleen niet meer tekenen.

Een vector v = (v₁, v₂, …, vₙ) is een geordende lijst getallen. Je kunt hem op twee manieren tegelijk lezen: als een locatie (het punt waar je terechtkomt) en als een richting met een lengte (de pijl die je daarheen brengt). Beide lezingen zijn voortdurend van belang in ML.

De norm (lengte) van een vector komt rechtstreeks uit Pythagoras, alleen met meer termen:

Waar dit voorkomt in MLWanneer een transformer beslist hoeveel het ene token aan een ander moet aandacht besteden, neemt hij het inproduct van een query en een key, q·k. Dat is dezelfde bewerking als het rangschikken van nearest neighbours in een embeddingruimte op cosinusgelijkenis, en dezelfde die een lineaire classifier gebruikt om te vragen aan welke kant van w·x + b = 0 een punt terechtkomt. Het meeste van wat in…
▶ Vectoren & meetkunde van Rⁿ
← Kwadratische vormenFuncties f: Rⁿ → R →