Parsial Orde Tinggi

Kalkulus multivariabel dari prinsip pertama

Sama seperti fungsi 1-D memiliki turunan kedua, fungsi multivariabel memiliki parsial orde kedua. Kamu menurunkan dua kali. Kerutan barunya adalah sekarang kamu bisa memilih variabel mana yang dipakai setiap kali, dan sesuatu yang rapi terjadi ketika kamu mencampurnya.

Parsial kedua murni ∂²f/∂x² dan ∂²f/∂y² mengukur kelengkungan sepanjang tiap sumbu. Parsial campuran ∂²f/∂x∂y menurunkan pertama terhadap y, lalu terhadap x; ia mengukur bagaimana kemiringan di satu arah berubah saat kamu bergerak di arah lain.

Parsial pertama memberi tahu Anda kecuraman lereng bukit; parsial kedua memberi tahu Anda bagaimana kecuraman itu sendiri berubah saat Anda bergerak, yang merupakan kelengkungan lereng. Berjalan ke timur, apakah tanah terus semakin curam atau mulai mendatar? Pembengkokan lereng ke arah timur ∂f/∂x saat Anda menekan lebih jauh ke timur adalah parsial kedua ∂²f/∂x², kelengkungan bukit di sepanjang arah tersebut.

Di mana ini berlaku dalam MLSimetri ini adalah alasan Hessian, matriks semua parsial kedua dari loss, menjadi simetris: Hᵢⱼ = ∂²L/∂wᵢ∂wⱼ = ∂²L/∂wⱼ∂wᵢ = Hⱼᵢ. Matriks simetris memiliki eigenvalue real dan eigenvector ortogonal (dari Aljabar Linear), yang memungkinkan kita membaca kelengkungan permukaan loss secara bersih sebagai mangkuk, kubah, atau pelana.
▶ Parsial Orde Tinggi
← Turunan ParsialGradien →