La Hessiana

Calcolo multivariabile dai primi principi

Il gradiente ha impacchettato tutte le derivate prime. La Hessiana impacchetta tutte le derivate seconde di una funzione scalare f: Rⁿ → R in una matrice. Dove il gradiente dà la pendenza, la Hessiana dà la curvatura: come la pendenza stessa cambia mentre ti muovi.

Per il teorema di Clairaut (Lezione 6), Hᵢⱼ = Hⱼᵢ, quindi la Hessiana è sempre simmetrica per le funzioni lisce che ci interessano. È un dono: le matrici simmetriche hanno autovalori reali e autovettori ortogonali, e quegli autovalori sono esattamente le curvature lungo le direzioni principali.

Se il gradiente è il tachimetro di una superficie, l'Hessiana è il suo cruscotto della curvatura: riporta come la pendenza stessa si sta piegando in tutte le direzioni contemporaneamente. Una superficie che si incurva verso l'alto tutto intorno a te si legge come il fondo di una valle; curvare verso il basso tutt'intorno si legge come la cima di una cupola; verso l'alto da una parte e verso il basso dall'altra è una sella. L'Hessiana racchiude tutto questo in un'unica griglia simmetrica di derivate seconde.

Dove si trova nel MLQuando la discesa del gradiente striscia giù per una valle lunga e stretta, rimbalzando lentamente contro le pareti ripide, la Hessiana spiega perché. I suoi autovalori sono le curvature in ciascuna direzione, e un'ampia diffusione tra esse (un alto numero di condizione) è esattamente quella valle: ripida da una parte, quasi piatta dall'altra. Metodi del secondo ordine come Newton, e nello…
▶ La Hessiana
← Geometria della JacobianaGeometria della Hessiana →