Тригонометрични функции

Изчисление на променлива от първи принципи

Тригонометрията звучи сякаш е свързана предимно с триъгълници, но версията, от която се нуждаете за ML, е по-изчистена: става дума за движение по окръжност. Представете си точка, която се движи по окръжност с радиус 1 и център в началото на координатната система — единичната окръжност. Докато се движи, проекцията ѝ върху всяка ос очертава двете важни функции.

Нека θ (тета) е ъгълът, на който точката се е завъртяла спрямо положителната посока на оста x. Тогава по дефиниция координатите на точката са (cos θ, sin θ). Това е всичко — cos е x-координатата, sin е y-координатата. Плъзнете точката по окръжността по-долу и наблюдавайте промяната на двете стойности.

Изхождайки от тези две, тангенсът е просто тяхното отношение, tan θ = sin θ / cos θ — наклонът на радиус-вектора.

Къде се използва това в MLПериодичните функции са начинът, по който моделите представят позиция и време. Позиционните кодирания при Трансформърите са изградени от синуси и косинуси на много честоти, така че мрежата да може да различава токените според тяхната позиция в последователността. Ротациите — които задвижват всичко от аугментацията на данни (data augmentation) до ротационните позиционни ембединги (RoPE) — се…
▶ Тригонометрични функции
← Експоненциал и логаритъмКратко: Векторни пространства от функции →