Случайни величини

Математиката на несигурността

Изходи като „ези“ или „трети червен картон“ са неудобни за аритметика. Една случайна величина решава този проблем: тя е правило, което съпоставя число на всеки изход. Формално това е функция X: Ω → ℝ. Хвърлете три монети и нека X отчита броя на падналите се ези. Сега всеки изход се съпоставя с 0, 1, 2 или 3 и вече можем да осредняваме, повдигаме на квадрат и сумираме тези стойности.

Карнавално колело спира на цветни сектори и всеки цвят изплаща различна сума: число, залепено към всеки изход. Това число е случайна величина X, парите, които печелите при завъртане. Изброяването колко често се пада всяко изплащане, p(x) = P(X = x), ви показва цялото разпределение на вашата награда.

За една дискретна случайна величина, функцията на вероятностната маса (PMF) p(x) = P(X = x) задава вероятността за всяка възможна стойност. Тя трябва да е неотрицателна, а сумата ѝ по целия носител трябва да е 1, което на практика са аксиомите на вероятностите, изразени с числа.

Къде се използва това в MLЕтикетът Y е случайна величина, както и предсказанието на модела. Операцията argmax върху слоя softmax, която определя прогнозирания клас, е случайна величина, преобразуваща изходното разпределение на модела в единичен индекс. Генерирането (семплирането) от езиков модел представлява теглене на стойност за случайна величина (следващия токен) от нейната PMF върху речника.
▶ Случайни величини
← НезависимостМатематическо очакване →