Cálculo multivariável a partir dos primeiros princípios
O gradiente reuniu todas as primeiras derivadas. A Hessiana reúne todas as segundas derivadas de uma função escalar f: Rⁿ → R numa matriz. Onde o gradiente dá a inclinação, a Hessiana dá a curvatura: como a própria inclinação varia à medida que você se desloca.
Pelo teorema de Clairaut (Lição 6), Hᵢⱼ = Hⱼᵢ, pelo que a Hessiana é sempre simétrica para as funções suaves que nos interessam. Isto é uma dádiva: as matrizes simétricas têm autovalores reais e autovetores ortogonais, e esses autovalores são exatamente as curvaturas ao longo das direções principais.
Se o gradiente é o velocímetro de uma superfície, o Hessiano é o seu painel de curvatura: ele relata como a própria inclinação está se curvando em todas as direções de uma só vez. Uma superfície curvando-se para cima em volta de você parece o fundo de um vale; curvando-se para baixo em toda a volta parece o topo de uma cúpula; para cima de um jeito e para baixo do outro é uma sela. O Hessiano empacota tudo isso em uma grade simétrica de derivadas de segunda ordem.