Matris Çarpımı

Geometry and algebra of linear maps, vectors, and matrices

Matris çarpımı zahmetli bir kural gibi görünür, ama anlamı nettir: AB, iki dönüşümün bileşkesidir. Önce B'yi, sonra A'yı uygula. Çarpım, her iki hareketi tek seferde gerçekleştiren tek matristir.

AB'nin bir bileşenini hesaplamak için A'nın bir satırını al ve onu B'nin bir sütunuyla skaler çarp. (i, j) bileşeni, A'nın i. satırı ile B'nin j. sütununun skaler çarpımıdır. Bütün algoritma budur: bir ızgaraya dizilmiş skaler çarpımlar.

Bir fabrika hattındaki iki makineyi hayal edin. İlk makine B bir parçayı yeniden şekillendirir, ardından ikinci makine A onu tekrar yeniden şekillendirir. AB ürünü, her iki adımı tek bir geçişte yapan tek birleştirilmiş makinedir — ve parça A'dan önce B'den geçmesi gerektiğinden hattaki sıra sabittir.

Bunun ML'deki yeriKatmanları birleştirmek matris çarpımının ta kendisidir. İki katmanlı bir lineer yığın W₂(W₁x), (W₂W₁)x'e eşittir; katmanlar tek bir dönüşümde kaynaşır. Dikkat (attention) mekanizmasında, skorlar bir QKᵀ çarpımından gelir ve çıktı, bu ağırlıkların V ile çarpılmasından gelir. Her ileri geçiş bu çarpımların bir zinciridir ve şekil kuralı, GPU'ların ezmek için inşa edildiği şeydir.
▶ Matris Çarpımı
← Lineer Dönüşümler Olarak MatrislerDevrik (Transpoz) →