Transformações

Cálculo de uma variável a partir dos primeiros princípios

Uma vez que conheces o formato de uma função, não precisas de redesenhar nada para entender toda uma família de parentes. Quatro operações simples movem, esticam e espelham um gráfico de maneiras totalmente previsíveis. Aprende a enxergá-las e traçar gráficos passa a ser reconhecimento, e não aritmética.

Isto é exatamente o que faz um editor de fotografias. Nunca redesenha a imagem píxel a píxel; empurra-a para o lado, estica-a para ficar mais alta, ou inverte-a horizontalmente, e a mesma forma aterra num novo local. Transformar uma função é o mesmo conjunto de edições de um só toque aplicado a um gráfico em vez de a uma fotografia.

Partindo de um formato base f(x): multiplicar a saída por a estica-a na vertical; multiplicar a entrada por b estica-a na horizontal; subtrair c por dentro desloca-a para a direita; somar d por fora eleva-a. Juntando tudo:

Onde isto aparece no MLIsto não é uma analogia — a batch normalization é literalmente esta transformação. Uma camada de batch-norm pega numa ativação normalizada x̂ e produz γ·x̂ + β, em que γ é uma escala aprendida (o a acima) e β é um deslocamento aprendido (o d). A rede aprende onde posicionar e quanto esticar cada ativação. O formato de uma função de ativação também é uma transformação: uma tanh "mais íngreme" é…

▶ Transformações

← Resumo: Espaços Vetoriais de Funções Par, ímpar, periodicidade →