Hessian

Multivariate calculus from first principles

Gradyan tüm birinci türevleri paketlemişti. Hessian, bir skaler fonksiyonun f: Rⁿ → R tüm ikinci türevlerini bir matrise paketler. Gradyan eğim verirken, Hessian eğrilik verir: etrafta dolaştıkça eğimin kendisinin nasıl değiştiğini.

Clairaut teoremine göre (Ders 6), Hᵢⱼ = Hⱼᵢ, yani Hessian, önemsediğimiz düzgün fonksiyonlar için her zaman simetriktir. Bu bir armağandır: simetrik matrislerin gerçek özdeğerleri ve dik özvektörleri vardır ve o özdeğerler tam olarak temel yönler boyunca eğriliklerdir.

Eğer gradyan bir yüzeyin hız göstergesiyse, Hessian onun eğrilik gösterge panelidir: eğimin kendisinin aynı anda her yönde nasıl büküldüğünü bildirir. Etrafınızda yukarı doğru kıvrılan bir yüzey, bir vadinin dibi gibi okunur; etrafınızda aşağı doğru kıvrılan bir yüzey bir kubbenin tepesi gibi okunur; bir yönde yukarı diğer yönde aşağı kıvrılan bir yüzey ise bir semerdir. Hessian tüm bunları ikinci türevlerin tek bir simetrik ızgarasına sığdırır.

Bunun ML'deki yeriGradyan inişi, dik duvarlardan yavaşça sekerek uzun dar bir vadiden aşağı süründüğünde, nedenini Hessian açıklar. Özdeğerleri her yöndeki eğriliklerdir ve aralarındaki geniş açıklık (yüksek bir koşul sayısı) tam olarak o vadidir: bir yönde dik, diğerinde neredeyse düz. Newton gibi ikinci mertebeden yöntemler ve ruhen Adam'ın parametre başına ölçeklemesi, bunu düzeltip yolu doğrultmak için…
▶ Hessian
← Jacobian GeometrisiHessian Geometrisi →