离散程度的度量

从数据中进行推断、估计和决策

中心告诉你数据位于哪里;离散程度告诉你数据围绕这个中心晃动多少。两个数据集可以有相同均值,却完全不同:一个紧密聚集,另一个到处散开。差别就在离散程度。

主力工具是方差:到均值的平均平方距离。它的平方根,即标准差,与数据处在同一单位中,因此更容易解释。

两个班级参加相同的测验,平均分都是 72,所以在纸面上它们看起来完全一样。但 A 班得分是 70, 72, 74(所有人都挤在一起),而 B 班得分是 50, 72, 94(非常分散)。相同的中心,完全不同的故事:离散程度正是区分它们的那个数字。

在机器学习中的应用离散程度在机器学习可靠性中无处不在。mini-batch 内的梯度方差控制每次训练步有多嘈杂;高方差意味着下降会抖动。而当你报告模型准确率时,不同随机种子下的标准差会告诉你“+0.3%”提升是真实的,还是噪声。没有离散程度的结果,只是半个结果。
▶ 离散程度的度量
← 中心位置的度量数据分布 →