Parciais de Ordem Superior

Cálculo multivariável a partir dos primeiros princípios

Tal como uma função 1-D tem segunda derivada, uma função multivariável tem parciais de segunda ordem. Você diferencia duas vezes. A novidade é que agora pode escolher qual a variável a diferenciar de cada vez, e algo elegante acontece quando você as mistura.

As parciais puras de segunda ordem ∂²f/∂x² e ∂²f/∂y² medem a curvatura ao longo de cada eixo. A parcial mista ∂²f/∂x∂y diferencia primeiro em relação a y e depois em relação a x; mede como a inclinação numa direção varia à medida que você se desloca na outra.

Uma primeira parcial lhe diz a inclinação da encosta; uma segunda parcial lhe diz como essa própria inclinação está mudando conforme você se move, o que é a curvatura da inclinação. Caminhando para o leste, o chão continua ficando mais íngreme ou começa a se nivelar? Essa flexão da inclinação para o leste ∂f/∂x enquanto você segue mais para o leste é a segunda parcial ∂²f/∂x², a curvatura da colina ao longo dessa direção.

Onde isso aparece no MLEsta simetria é a razão pela qual a Hessiana, a matriz de todas as parciais de segunda ordem da loss, sai simétrica: Hᵢⱼ = ∂²L/∂wᵢ∂wⱼ = ∂²L/∂wⱼ∂wᵢ = Hⱼᵢ. Uma matriz simétrica tem autovalores reais e autovetores ortogonais (da Álgebra Linear), que é o que nos permite ler a curvatura da superfície de loss de forma limpa, como uma tigela, uma cúpula ou uma sela.
▶ Parciais de Ordem Superior
← Derivadas ParciaisO Gradiente →