Cálculo multivariável a partir dos primeiros princípios
O gradiente reuniu todas as primeiras derivadas. A Hessiana reúne todas as segundas derivadas de uma função escalar f: Rⁿ → R numa matriz. Onde o gradiente dá o declive, a Hessiana dá a curvatura: como o próprio declive varia à medida que te deslocas.
Pelo teorema de Clairaut (Lição 6), Hᵢⱼ = Hⱼᵢ, pelo que a Hessiana é sempre simétrica para as funções suaves que nos interessam. Isto é uma dádiva: as matrizes simétricas têm valores próprios reais e vetores próprios ortogonais, e esses valores próprios são exatamente as curvaturas ao longo das direções principais.
Se o gradiente é o velocímetro de uma superfície, a matriz hessiana é o seu painel de curvatura: reporta como a própria inclinação se curva em todas as direções de uma só vez. Uma superfície que curva para cima a toda a volta lê-se como o fundo de um vale; que curva para baixo a toda a volta lê-se como o topo de uma cúpula; para cima num sentido e para baixo noutro é uma sela. A matriz hessiana condensa tudo isso numa grelha simétrica de segundas derivadas.