Parciais de Ordem Superior

Cálculo multivariável a partir dos primeiros princípios

Tal como uma função 1-D tem segunda derivada, uma função multivariável tem parciais de segunda ordem. Diferencias duas vezes. A novidade é que agora podes escolher qual a variável a diferenciar de cada vez, e algo elegante acontece quando as misturas.

As parciais puras de segunda ordem ∂²f/∂x² e ∂²f/∂y² medem a curvatura ao longo de cada eixo. A parcial mista ∂²f/∂x∂y diferencia primeiro em relação a y e depois em relação a x; mede como o declive numa direção varia à medida que te deslocas na outra.

Uma primeira derivada parcial indica a inclinação da colina; uma segunda derivada parcial diz como a própria inclinação está a mudar à medida que se move, o que é a curvatura da inclinação. Caminhando para este, o chão continua a ficar mais íngreme ou começa a nivelar? Essa flexão da inclinação para este ∂f/∂x à medida que avança mais para este é a segunda derivada parcial ∂²f/∂x², a curvatura da colina ao longo dessa direção.

Onde isto aparece no MLEsta simetria é a razão pela qual a Hessiana, a matriz de todas as parciais de segunda ordem da loss, sai simétrica: Hᵢⱼ = ∂²L/∂wᵢ∂wⱼ = ∂²L/∂wⱼ∂wᵢ = Hⱼᵢ. Uma matriz simétrica tem autovalores reais e autovetores ortogonais (da Álgebra Linear), que é o que nos permite ler a curvatura da superfície de loss de forma limpa, como uma tigela, uma cúpula ou uma sela.
▶ Parciais de Ordem Superior
← Derivadas ParciaisO Gradiente →