Yönlü Türev

Multivariate calculus from first principles

Kısmi türevler sana yalnızca koordinat eksenleri boyunca eğimi söyler, ama herhangi bir yönde yürüyüp gidebilirsin. Yönlü türev D_u f şunu yanıtlar: u birim vektörü boyunca adım atarsam, f ne kadar hızlı değişir? Cevabın, gradyanla tek bir iç çarpım olduğu ortaya çıkar.

Aynı tepeden yürüyüşe çıktığınızı hayal edin, ancak doğrudan yokuş yukarı bakmak yerine bir pusula kerterizi seçin, diyelim ki kuzey-doğu, ve o yönde yürüyün. Yönlü türev D_u f, o istikamet boyunca çizmelerinizin altında gerçekten hissettiğiniz eğimdir. En dik yöne doğru ilerlerseniz tırmanışın tamamını hissedersiniz; yamaç boyunca yan tarafa dönerseniz zemin düz hissedilir.

D_u f = ∇f·u = ‖∇f‖‖u‖cos θ = ‖∇f‖cos θ olduğundan (çünkü u bir birim vektördür), değişim oranı tam olarak cos θ = 1 olduğunda, yani u, ∇f boyunca işaret ettiğinde en büyüktür. Aşağıdaki yön okunu döndür ve eğim göstergesinin gradyanla hizalandığında zirve yaptığını, dik olduğunda yok olduğunu izle.

Bunun ML'deki yeriBu, gradyan inişini haklı çıkaran teoremdir. Atabileceğin tüm yönler arasında, −∇L kanıtlanabilir şekilde kaybı en hızlı azaltır. Yani eğitimin neden başka bir yön yerine gradyan boyunca adım attığını merak edersen, cevap budur: gradyan en iyi yerel seçimdir, bu yüzden w ← w − η∇L evrensel güncellemedir.
▶ Yönlü Türev
← GradyanDoğrusal Yaklaşım →