PDF и CDF

Математиката на несигурността

За непрекъснати величини като височина, тегло или интензитет на пикселите, търсенето на вероятността за точна стойност като P(X = 3.0000…) е безсмислено: има безброй много възможни стойности, затова вероятността за всяка една е нулева. Вместо това, ние описваме как вероятността е разпределена чрез функция на плътност на вероятността (PDF) f(x) и пресмятаме вероятностите като лице на площи (области).

Самата плътност не е вероятност и може да надхвърли 1. Изискванията към нея са две: да е неотрицателна и общата площ под нея да е равна на 1 – това е непрекъснатият еквивалент на правилото „сумата от стойностите на PMF е 1“:

Плъзнете μ и σ по-горе: кривата се плъзга и разтяга, но площта под нея винаги остава точно 1. Вероятността за даден интервал е частта от площта, разположена над него.

Къде се използва това в MLИзходът p(x | θ) на един генеративен модел е функция на плътността. За да генерирате (семплирате) стойности от 1-D разпределение, можете да използвате семплиране с обратна трансформация (inverse transform sampling): генерирайте равномерно разпределено число u ∈ [0,1] и върнете F⁻¹(u), като обърнете CDF. Нормализиращите потоци (Normalizing flows) обобщават точно тази идея, научавайки обратима…
▶ PDF и CDF
← Основни дискретни разпределенияОчакване и отклонение (непрекъснато) →