置信区间

从数据中进行推断、估计和决策

像 x̄ = 5.2 这样的点估计几乎肯定不精确等于真实均值，所以只给一个数字并不诚实。置信区间报告一个范围加一个置信水平：“真实 θ 位于 [L, U]，置信度为 95%。”它量化了有限样本让你能多信任这个估计。

最常见的情况使用中心极限定理：样本均值近似正态，因此区间就是估计值加减一个误差边界：

标准误 σ/√n 会随着 n 增大而缩小：四倍数据会让边界减半。z 值设定置信度：95% 用 1.96，99% 用 2.576。

在机器学习中的应用这就是诚实的机器学习论文报告结果的方式。“91.2% ± 0.4%”准确率就是置信区间；± 是误差条。当两个模型的区间高度重叠时，“胜者”可能只是采样幸运。当总体 σ 未知或分布奇怪时，bootstrap（对测试集有放回重采样）可以经验地构建区间，不需要公式。