多变量 Gaussian

不确定性的数学

真实数据很少只是一个数字。它通常是一个向量。多变量 Gaussian N(μ, Σ) 把钟形曲线扩展到多维。均值变成向量 μ ∈ ℝⁿ(点云中心),方差变成协方差矩阵 Σ(点云的形状和倾斜)。

指数项推广了 z-score:(x−μ)ᵀΣ⁻¹(x−μ) 是平方的 Mahalanobis 距离,也就是用数据自身的扩散单位来衡量离均值有多远。等密度点形成椭圆(高维中是椭球);协方差矩阵决定它们的大小、拉伸和倾斜。

Σ 的对角线保存每个坐标的方差;非对角线保存协方差,告诉你坐标是否一起上升。对角的 Σ 给出轴对齐椭圆(坐标独立);非对角项会让椭圆倾斜。Σ 必须是半正定的,因为任何方向上都不存在负方差。

在机器学习中的应用Gaussian process 做带误差条的回归时,会在函数上放置一个多变量 Gaussian。VAE 的潜变量先验是标准多变量正态 N(0, I)。Gaussian 潜变量模型和扩散模型的噪声调度,都依赖这样一个事实:Gaussian 的线性映射和条件分布仍然是 Gaussian。
▶ 多变量 Gaussian
← 关键连续分布联合分布 →