Cálculo multivariable desde primeros principios
El gradiente empaquetó todas las primeras derivadas. El Hessiano empaqueta todas las segundas derivadas de una función escalar f: Rⁿ → R en una matriz. Mientras que el gradiente da la pendiente, el Hessiano da curvatura: cómo cambia la pendiente misma a medida que te mueves.
Por el teorema de Clairaut (Lección 6), Hᵢⱼ = Hⱼᵢ, por lo tanto, el Hessiano siempre es simétrico para las funciones suaves con las que nos preocupamos. Eso es un regalo: las matrices simétricas tienen valores propios reales y vectores propios ortogonales, y esos valores propios son exactamente las curvaturas a lo largo de las direcciones principales.
Si el gradiente es el velocímetro de una superficie, el hessiano es su panel de curvatura: informa cómo se curva la pendiente en sí en todas las direcciones a la vez. Una superficie que se curva hacia arriba a tu alrededor se lee como el fondo de un valle; si se curva hacia abajo a tu alrededor se lee como la cima de una cúpula; hacia arriba en un sentido y hacia abajo en otro es una silla de montar. El hessiano empaqueta todo eso en una cuadrícula simétrica de segundas derivadas.