从数据中进行推断、估计和决策
拟合回归很容易。更难的问题是你能否信任它。模型诊断是捕捉“数值上拟合了,但违反底层假设”的模型的检查。最有用的对象是残差:e = y − ŷ,也就是模型没能解释的剩余部分。
如果模型正确,残差应该看起来像纯噪声:没有模式、离散程度恒定、大致对称。主要工具是残差图:y 轴是残差,x 轴是拟合值(或某个输入)。你要寻找本不该存在的结构。
好医生不会在说出病名后就停止;他们会检查治疗后留下了什么症状。如果病人仍然有顽固的咳嗽,说明诊断遗漏了什么。残差是一个模型留下的症状:这是拟合线无法解释的那部分数据。如果它们显示出一种清晰的模式,而不是无害的随机噪声,那么该模型也一定遗漏了什么。