データからの推論、推定、意思決定
回帰をフィットするのは簡単な部分です。より難しい問いはそれを信頼できるかです。モデルの診断は数値にフィットするが背後の仮定に違反するモデルを捉えるチェックです。最も有用な見るオブジェクトは残差です:e = y − ŷ、モデルが説明できなかった残り。
モデルが正しければ、残差は純粋なノイズに見えるはずです:パターンなし、一定の広がり、ほぼ対称。主なツールは残差プロットです:y軸に残差、x軸にフィット値(または入力)。あるべきでない構造を探す。
良い医者は病名をつけるだけでは終わりません。治療後にどんな症状が残っているかを確認します。患者にしつこい咳がまだある場合、その診断は何かを見落としています。残差とは、モデルの残された症状です。つまり、適合された直線が説明できなかったデータの一部です。無害なランダムノイズの代わりに明確なパターンを示している場合、モデルも何かを見落としているのです。