चरों के बीच संबंध

डेटा से अनुमान, आकलन और निर्णय निर्माण

अब तक हर चर अकेला। वास्तविक प्रश्न सामान्यतः दो चर एक साथ: क्या अध्ययन समय ग्रेड से संबंध? क्या मॉडल आकार सटीकता से? पहला उपकरण एक बिखराव आलेख (प्रति अवलोकन एक बिंदु, x बनाम y), जो आँख को तुरंत प्रवृत्ति देखने।

एक रैखिक प्रवृत्ति पर संख्या के लिए, पियर्सन सहसंबंध गुणांक r। यह −1 से +1: +1 पूर्ण ऊपर रेखा, −1 पूर्ण नीचे रेखा, 0 कोई रैखिक संबंध नहीं।

आकृति में, बिंदु फिट रेखा से जितने कसकर चिपकते, |r| 1 के जितने निकट। फैलाएँ और r 0 की ओर।

ML में इसका स्थानसहसंबंध विश्लेषण एक दैनिक ML उपकरण। अत्यधिक सहसंबद्ध विशेषताएँ अनावश्यक; वे रैखिक मॉडलों में प्रसरण बढ़ाती (बहुसहरेखीयता) और क्षमता बर्बाद। और एक मूल्यांकन बेंचमार्क चुनते, आप जाँचते क्या यह उस मेट्रिक से सहसंबद्ध जिसकी आप वास्तव में परवाह; एक सस्ता प्रॉक्सी मेट्रिक केवल उपयोगी यदि यह महंगे वास्तविक का अनुसरण।
▶ चरों के बीच संबंध
← डेटा के वितरणपैरामीटर और अनुमानक →