Lineer Dönüşümler Olarak Matrisler

Geometry and algebra of linear maps, vectors, and matrices

Bir matris sayılardan oluşan bir ızgaradan fazlasıdır. O, uzayı dönüştüren bir fonksiyondur: ona bir x vektörü ver, sana yeni bir Ax vektörü geri versin. Tüm düzlem boyunca her noktaya aynı anda uygulanan tek tutarlı bir hareket gibi davranır (bir döndürme, bir germe, bir yansıma, bir kayma, bir izdüşüm).

Onu lineer yapan şey, iki vektör işlemine saygı göstermesidir: A(x + y) = Ax + Ay ve A(cx) = c·Ax. Doğrular düz kalır, orijin yerinde durur ve eşit aralıklı ızgaralar eşit aralıklı (belki eğik) ızgaralara eşlenir.

İşte bir matrisi gözle okumanın yolu: sütunları, taban vektörlerinin indiği yerlerdir. İlk sütun [1, 0]'ın görüntüsüdür; ikinci sütun [0, 1]'in görüntüsüdür. İki eksenin nereye gittiğini bir kez bildiğinde, tüm dönüşüm belirlenir, çünkü diğer her vektör onların bir kombinasyonudur.

Bunun ML'deki yeriBir sinir ağının ağırlık matrisi W tam olarak budur: doğrusal olmayanlık devreye girmeden önce aktivasyon uzayını yeniden şekillendiren bir lineer dönüşüm. Her katman, girdisini bir sonraki katmanın işinin daha kolay olduğu yeni bir koordinat sistemine döndürür, gerer ve izdüşürür. "Bir katmanı öğrenmek", eksenlerin nereye gönderileceğini öğrenmek, yani W'nin sütunlarını öğrenmek demektir.

▶ Lineer Dönüşümler Olarak Matrisler

← Lineer Bağımsızlık ve Taban Matris Çarpımı →