Funções Trigonométricas

Cálculo de uma variável a partir dos primeiros princípios

A trigonometria parece coisa de triângulos, mas a versão de que precisas para ML é mais limpa: trata-se de percorrer um círculo. Imagina um ponto a viajar à volta de um círculo de raio 1 centrado na origem — o círculo unitário. À medida que se move, a sua sombra em cada eixo traça as duas funções que importam.

Seja θ (teta) o ângulo que o ponto percorreu a partir do eixo x positivo. Então, por definição, o ponto está em (cos θ, sin θ). É só isto — cos é a coordenada x, sin é a coordenada y. Arrasta o ponto à volta do círculo abaixo e observa as duas leituras a mudar.

A partir destas duas, a tangente é apenas a razão entre elas, tan θ = sin θ / cos θ — o declive da reta que contém o raio.

Onde isto aparece no MLFunções periódicas são a forma como os modelos representam posição e tempo. As codificações posicionais dos Transformers são construídas a partir de senos e cossenos em muitas frequências, para que a rede consiga distinguir os tokens pela posição que ocupam numa sequência. As rotações — que sustentam tudo, desde a ampliação de dados até aos embeddings rotacionais da atenção (RoPE) — são expressas…
▶ Funções Trigonométricas
← Exponencial & LogaritmoResumo: Espaços Vetoriais de Funções →