El Hessiano

Cálculo multivariable desde primeros principios

El gradiente empaquetó todas las primeras derivadas. El Hessiano empaqueta todas las segundas derivadas de una función escalar f: Rⁿ → R en una matriz. Mientras que el gradiente da la pendiente, el Hessiano da curvatura: cómo cambia la pendiente misma a medida que te mueves.

Por el teorema de Clairaut (Lección 6), Hᵢⱼ = Hⱼᵢ, por lo tanto, el Hessiano siempre es simétrico para las funciones suaves con las que nos preocupamos. Eso es un regalo: las matrices simétricas tienen valores propios reales y vectores propios ortogonales, y esos valores propios son exactamente las curvaturas a lo largo de las direcciones principales.

Si el gradiente es el velocímetro de una superficie, el hessiano es su panel de curvatura: informa cómo se curva la pendiente en sí en todas las direcciones a la vez. Una superficie que se curva hacia arriba a tu alrededor se lee como el fondo de un valle; si se curva hacia abajo a tu alrededor se lee como la cima de una cúpula; hacia arriba en un sentido y hacia abajo en otro es una silla de montar. El hessiano empaqueta todo eso en una cuadrícula simétrica de segundas derivadas.

Dónde aparece en el MLCuando el descenso del gradiente se arrastra hacia abajo de un valle largo y estrecho, rebota lentamente en las paredes empinadas, el Hessiano explica por qué. Sus valores propios son las curvaturas en cada dirección, y una gran dispersión entre ellos (un número de condición) es exactamente ese valle: empinado de un lado, casi plano del otro. Los métodos de segundo orden como Newton, y en…
▶ El Hessiano
← Geometría JacobianaGeometría del Hessian →