关键连续分布

不确定性的数学

除了 Gaussian 之外,还有几个连续分布会反复出现。每个分布回答一种不同问题:“在某个范围内任意位置?”、“到下一个事件还要等多久?”、“一个未知概率本身如何分布?”

Uniform U(a, b) 把概率平坦地分布在一个区间上,密度为常数 1/(b−a)。它是默认的“除了范围我什么都不知道”,也是采样的原材料:每个随机数生成器都从 U(0,1) 开始。

Exponential(λ) 建模当事件以稳定平均速率 λ 发生时,到下一次随机事件的等待时间。它是无记忆的:已经等了一段时间,并不会改变还要继续等待的时间分布。

在机器学习中的应用Dirichlet 是“分布上的分布”:它生成主题模型(LDA)中的混合权重,以及 Bayesian 分类器要平均的类别概率。Beta 是估计某个概率时常用的先验,比如点击率或硬币偏置,并支撑 bandit 中的 Thompson sampling。Uniform 是其他每个采样器要变换的熵源。
▶ 关键连续分布
← Gaussian 分布多变量 Gaussian →