Funções Trigonométricas

Cálculo de uma variável a partir dos primeiros princípios

Trigonometria parece coisa de triângulos, mas a versão de que você precisa para ML é mais limpa: trata-se de percorrer um círculo. Imagine um ponto viajando ao redor de um círculo de raio 1 centrado na origem — o círculo unitário. À medida que ele se move, sua sombra em cada eixo traça as duas funções que importam.

Seja θ (teta) o ângulo que o ponto percorreu a partir do eixo x positivo. Então, por definição, o ponto está em (cos θ, sin θ). É só isso — cos é a coordenada x, sin é a coordenada y. Arraste o ponto ao redor do círculo abaixo e observe as duas leituras mudarem.

A partir dessas duas, a tangente é apenas a razão entre elas, tan θ = sin θ / cos θ — a inclinação da reta que contém o raio.

Onde isso aparece no MLFunções periódicas são a forma como os modelos representam posição e tempo. As codificações posicionais dos Transformers são construídas a partir de senos e cossenos em muitas frequências, para que a rede consiga distinguir os tokens pela posição que ocupam em uma sequência. As rotações — que sustentam tudo, desde a ampliação de dados até os embeddings rotacionais da atenção (RoPE) — são…
▶ Funções Trigonométricas
← Exponencial & LogaritmoResumo: Espaços Vetoriais de Funções →