A Hessiana

Cálculo multivariável a partir dos primeiros princípios

O gradiente reuniu todas as primeiras derivadas. A Hessiana reúne todas as segundas derivadas de uma função escalar f: Rⁿ → R numa matriz. Onde o gradiente dá a inclinação, a Hessiana dá a curvatura: como a própria inclinação varia à medida que você se desloca.

Pelo teorema de Clairaut (Lição 6), Hᵢⱼ = Hⱼᵢ, pelo que a Hessiana é sempre simétrica para as funções suaves que nos interessam. Isto é uma dádiva: as matrizes simétricas têm autovalores reais e autovetores ortogonais, e esses autovalores são exatamente as curvaturas ao longo das direções principais.

Se o gradiente é o velocímetro de uma superfície, o Hessiano é o seu painel de curvatura: ele relata como a própria inclinação está se curvando em todas as direções de uma só vez. Uma superfície curvando-se para cima em volta de você parece o fundo de um vale; curvando-se para baixo em toda a volta parece o topo de uma cúpula; para cima de um jeito e para baixo do outro é uma sela. O Hessiano empacota tudo isso em uma grade simétrica de derivadas de segunda ordem.

Onde isso aparece no MLQuando o gradiente descendente rasteja por um vale longo e estreito, ressaltando lentamente entre as paredes acentuadas, a Hessiana explica porquê. Os seus autovalores são as curvaturas em cada direção, e uma grande diferença entre eles (um elevado número de condição) é exatamente esse vale: acentuado de um lado, quase plano do outro. Os métodos de segunda ordem como o de Newton, e, em espírito,…
▶ A Hessiana
← Geometria da JacobianaGeometria da Hessiana →