Тригонометрия звучит как треугольники, но версия, нужная для ML, чище: речь о движении по кругу. Представьте точку, идущую по кругу радиуса 1 с центром в начале координат — единичная окружность. При движении её тень на каждой оси обрисовывает две важные функции.
Пусть θ (тета) — угол, на который точка отмерена от положительной оси x. Тогда по определению точка в (cos θ, sin θ). Всё — cos — x-координата, sin — y-координата. Двигайте точку по кругу ниже и наблюдайте, как меняются оба значения.
Из этих двух тангенс — просто их отношение, tan θ = sin θ / cos θ — наклон радиус-линии.
Где это встречается в MLПериодические функции — способ моделей представлять позицию и время. Позиционные кодирования трансформера построены из синусов и косинусов разных частот, чтобы сеть различала токены по их месту в последовательности. Повороты — на которых работают от аугментации данных до ротариных эмбеддингов внимания (RoPE) — выражаются ровно через cos θ и sin θ на этом круге.