Очакване и отклонение (непрекъснато) — Вероятност

Всичко, което научихте за математическото очакване и дисперсията, се пренася към непрекъснатите величини. Просто заменяте сумирането с интегриране. Тежестта на PMF p(x) се превръща в плътност f(x) dx, а „сумиране по всички стойности“ става „интегриране по числовата ос“.

Интуицията е същата: E[X] все още е центърът на тежестта (точката на баланс) на функцията на плътността, а дисперсията все още е средното квадратично разстояние от тази точка. Линейността и правилото за мащабиране Var(aX+b)=a²Var(X) важат непроменени.

Представете си люлка-везна с тежест, размазана неравномерно по дъската, вместо да стои в една точка. Единственото място, където се балансира, е E[X], средната стойност на плътността. Колко далеч е изхвърлена тежестта от тази опорна точка, измерено като средно квадратно разстояние, е Var(X): тежест, струпана близо до центъра, означава малка дисперсия, тежест, изтласкана към далечните краища, означава голяма дисперсия.

Къде се използва това в MLПри непрекъснатите величини очакванията са интеграли, а интегралите в пространства с висока размерност обикновено са нерешими аналитично. Затова машинното обучение се основава на оценката на Монте Карло (Monte Carlo estimation): апроксимираме E[g(X)] = ∫ g(x)f(x)dx със средноаритметичното (1/n) Σ g(xᵢ) за проби xᵢ, генерирани от разпределението f. Всяка „очаквана награда“ в Reinforcement Learning…