条件分布

不确定性的数学

条件分布是把条件概率提升到整个随机变量。给定 X = x 后，Y 如何分布？你取联合分布，并用被固定变量的边缘分布重新归一化：

这和第 3 课中的放大并重新归一化是同一个动作：固定 X = x（选择联合表的一行），然后重新缩放这一行，使其概率和为 1。结果是一个关于 Y 的真正分布，并且每个 x 都有一个。

回到身高-体重表格，但现在只看单个的一行——比如，只看高个子的人——并忽略其他所有人。那一行数字本身加起来不为 1，所以你要重新缩放它们直到它们的和为 1，然后你得到的就是在给定身高是高个子的情况下体重的分布。这就是一个条件分布：将 X = x 固定为一个类别，然后将该切片重新归一化为在 Y 上的一个适当分布。

在机器学习中的应用判别式模型就是一个条件分布：p(y | x) 正是分类器或回归器学习的东西，即给定输入后的标签分布。VAE 或扩散模型中的解码器是条件分布 p(x | z)，即给定潜代码后的数据分布。条件化是生成模型控制输出的方式：文生图就是从 p(image | prompt) 中采样。

▶ 条件分布

← 边缘分布协方差与相关 →