置信区间
从数据中进行推断、估计和决策
像 x̄ = 5.2 这样的点估计几乎肯定不精确等于真实均值,所以只给一个数字并不诚实。置信区间报告一个范围加一个置信水平:“真实 θ 位于 [L, U],置信度为 95%。”它量化了有限样本让你能多信任这个估计。
最常见的情况使用中心极限定理:样本均值近似正态,因此区间就是估计值加减一个误差边界:
标准误 σ/√n 会随着 n 增大而缩小:四倍数据会让边界减半。z 值设定置信度:95% 用 1.96,99% 用 2.576。
在机器学习中的应用这就是诚实的机器学习论文报告结果的方式。“91.2% ± 0.4%”准确率就是置信区间;± 是误差条。当两个模型的区间高度重叠时,“胜者”可能只是采样幸运。当总体 σ 未知或分布奇怪时,bootstrap(对测试集有放回重采样)可以经验地构建区间,不需要公式。
▶ 置信区间