条件分布

不确定性的数学

条件分布是把条件概率提升到整个随机变量。给定 X = x 后,Y 如何分布?你取联合分布,并用被固定变量的边缘分布重新归一化:

这和第 3 课中的放大并重新归一化是同一个动作:固定 X = x(选择联合表的一行),然后重新缩放这一行,使其概率和为 1。结果是一个关于 Y 的真正分布,并且每个 x 都有一个。

回到身高-体重表格,但现在只看单个的一行——比如,只看高个子的人——并忽略其他所有人。那一行数字本身加起来不为 1,所以你要重新缩放它们直到它们的和为 1,然后你得到的就是在给定身高是高个子的情况下体重的分布。这就是一个条件分布:将 X = x 固定为一个类别,然后将该切片重新归一化为在 Y 上的一个适当分布。

在机器学习中的应用判别式模型就是一个条件分布:p(y | x) 正是分类器或回归器学习的东西,即给定输入后的标签分布。VAE 或扩散模型中的解码器是条件分布 p(x | z),即给定潜代码后的数据分布。条件化是生成模型控制输出的方式:文生图就是从 p(image | prompt) 中采样。
▶ 条件分布
← 边缘分布协方差与相关 →