随机变量

不确定性的数学

像“正面”或“第三张红牌”这样的结果不方便做算术。随机变量解决了这个问题:它是一条规则,把每个结果对应到一个数字。形式上,X: Ω → ℝ。抛三枚硬币,让 X 计数正面个数。现在每个结果都映射到 0、1、2 或 3,我们就可以求平均、平方和求和。

一个嘉年华转盘停在彩色楔形区域上,每种颜色支付不同的金额:这是一个贴在每个结果上的数字。那个数字是一个随机变量 X,即你在一次旋转中赢得的现金。列出每次支出的出现频率,p(x) = P(X = x),会告诉你奖金的完整分布。

对离散随机变量,概率质量函数 p(x) = P(X = x) 列出每个取值的概率。它必须非负,并且在支持集上的和为 1,这只是把公理重新表达在数字上。

在机器学习中的应用标签 Y 是随机变量,模型预测也是随机变量。softmax 的 argmax,也就是预测类别,是把模型输出分布映射到单个索引的随机变量。从语言模型采样,就是从词表上的 PMF 中抽取随机变量(下一个 token)。
▶ 随机变量
← 独立性期望 →