삼각 함수

제1원리에서 출발하는 일변수 미적분

삼각법이라고 하면 삼각형이 떠오르지만, ML에 필요한 형태는 그보다 더 깔끔합니다. 바로 원을 따라 도는 것이죠. 원점을 중심으로 반지름이 1인 원, 즉 단위원을 따라 점 하나가 움직인다고 상상해 보세요. 점이 움직이는 동안 각 축 위에 드리우는 그림자가 가장 중요한 두 함수를 그려 냅니다.

θ(세타)를 점이 양의 x축에서부터 휩쓸고 지나온 각이라고 합시다. 그러면 정의에 따라 점은 (cos θ, sin θ)에 자리합니다. 이것이 전부입니다 — cos은 x좌표, sin은 y좌표입니다. 아래 원에서 점을 빙 둘러 드래그하면서 두 값이 어떻게 변하는지 살펴보세요.

이 두 값으로부터 탄젠트는 단지 그 비율, 즉 tan θ = sin θ / cos θ로 정의됩니다. 반지름 선의 기울기인 셈입니다.

머신러닝에서의 위치주기 함수는 모델이 위치와 시간을 표현하는 방식입니다. 트랜스포머의 위치 부호화는 여러 주파수의 사인과 코사인으로 구성되어, 신경망이 시퀀스에서 토큰들이 어느 위치에 있는지로 서로 구별할 수 있게 해 줍니다. 또한 데이터 증강부터 어텐션의 회전 임베딩(RoPE)에 이르기까지 모든 것을 떠받치는 회전은, 바로 이 원 위의 cos θ와 sin θ로 표현됩니다.
▶ 삼각 함수
← 지수와 로그간략: 함수의 벡터 공간 →