偏差-方差分解
从数据中进行推断、估计和决策
为什么一个能完美拟合训练数据的模型在新数据上却常常失败?偏差-方差分解给出了精确而定量的答案。它把模型的期望预测误差拆成三部分,其中两部分朝相反的方向拉扯。
偏差²是来自错误假设的误差:模型太简单,无法刻画真相(欠拟合)。方差是来自对特定训练样本敏感的误差:模型太灵活,以至于记住了噪声(过拟合)。噪声是不可约的:数据中任何模型都无法消除的随机性。
在图中滑动复杂度。随着模型变得更复杂,偏差²(绿色)下降,但方差(珊瑚色)上升。总测试误差(黑色)是二者之和再加上噪声底线:一条U 形曲线,其最低点就是最优复杂度。
在机器学习中的应用这个分解就是欠拟合与过拟合的理论,也是你解读学习曲线的方式。训练误差和测试误差都高 = 高偏差 = 欠拟合(用更大的模型)。训练误差低但测试误差高 = 高方差 = 过拟合(正则化、获取更多数据,或简化模型)。选择模型复杂度,本质上就是在寻找这条 U 形曲线的最低点。
▶ 偏差-方差分解