डेटा से अनुमान, आकलन और निर्णय निर्माण
एक मॉडल जो प्रशिक्षण डेटा पूर्ण फिट वह नए डेटा पर क्यों विफल? पक्षपात–प्रसरण अपघटन सटीक, मात्रात्मक उत्तर। यह एक मॉडल की अपेक्षित भविष्यवाणी त्रुटि को तीन टुकड़ों में, और दो विपरीत खींचते।
पक्षपात² गलत मान्यताओं से त्रुटि: एक मॉडल सत्य पकड़ने के लिए बहुत सरल (अधिक्यष्टि)। प्रसरण विशेष प्रशिक्षण नमूने के प्रति संवेदनशीलता से त्रुटि: एक मॉडल इतना लचीला कि शोर रटता (न्यून्यष्टि)। शोर अपरिहार्य: डेटा में यादृच्छिकता जो कोई मॉडल हटा नहीं सकता।
आकृति में जटिलता खिसकाएँ। मॉडल जितना जटिल, पक्षपात² (हरा) गिरता लेकिन प्रसरण (प्रवाल) बढ़ता। कुल परीक्षण त्रुटि (काला) उनका योग घटा शोर तल: एक U-आकार जिसका तल अनुकूल जटिलता।