Vektörler ve Rⁿ Geometrisi

Multivariate calculus from first principles

Tek değişkenli analiz bir doğru üzerinde yaşıyordu. Makine öğrenmesi öyle değil. Bir sinir ağının ağırlıkları, bir gömme (embedding), bir gradyan: her biri yüksek boyutlu uzayda bir noktadır, Rⁿ. İyi haber şu ki düz düzlem R²'den bildiğin geometri neredeyse kelimesi kelimesine aktarılır. Vektör hâlâ orijinden çıkan bir oktur; uzunluk, açı ve "başka bir vektör üzerine düşen gölge" hepsi hâlâ anlamlıdır. Sadece onu çizemez hâle geliriz.

Bir vektör v = (v₁, v₂, …, vₙ) sıralı bir sayı listesidir. Onu aynı anda iki şekilde okuyabilirsin: bir konum olarak (üzerine düştüğün nokta) ve uzunluğu olan bir yön olarak (seni oraya götüren ok). Her iki okuma da makine öğrenmesinde sürekli önemlidir.

Bir vektörün normu (uzunluğu) doğrudan Pisagor'dan gelir, sadece daha fazla terimle:

Bunun ML'deki yeriBir transformer, bir tokenin başka bir tokene ne kadar dikkat etmesi gerektiğine karar verirken, bir sorgu (query) ile bir anahtarın (key) iç çarpımını alır, q·k. Bu, bir gömme uzayında en yakın komşuları kosinüs benzerliğiyle sıralamakla aynı işlemdir ve bir doğrusal sınıflandırıcının bir noktanın w·x + b = 0'ın hangi tarafına düştüğünü sorarken kullandığı işlemle aynıdır. Makine öğrenmesinde…
▶ Vektörler ve Rⁿ Geometrisi
← Karesel Formlarf: Rⁿ → R Fonksiyonları →