SVD द्वारा PCA

रैखिक मानचित्र, सदिशों और आव्यूहों की ज्यामिति और बीजगणित

मुख्य घटक विश्लेषण वे दिशाएँ खोजत जिनमें आपका डेटा सबसे अधिक बदलता, फिर हर बिंदु को सभी मूल विशेषताओं के बजाय कुछ दिशाओं से वर्णन देता। यह विमा-न्यूनीकरण का मानक उपकरण, और भीतर यह आपके डेटा पर SVD।

विधि संक्षिप्त। डेटा केंद्रित करें (माध्य घटाएँ ताकि बादल मूल बिंदु पर), डेटा आव्यूह का SVD लें, और उत्तर पढ़ें: मुख्य घटक शीर्ष एकल दिशाएँ, और प्रत्येक घटक का प्रसरण उसका एकल मान वर्ग (n−1 पर)।

एक तनी, झुकी बिंदुओं के बादल कल्पना। पहला मुख्य घटक बादल का लंबा अक्ष, वह एकल दिशा सबसे अधिक प्रसरण पकड़ती। दूसरा उसके लंबवत, बाकी का सबसे अधिक, और आगे। पहले कुछ पर प्रक्षेप और आप आकृति रखते विमा छोड़ते।

ML में इसका स्थानPCA क्लासिक विमा-न्यूनीकरण उपकरण: प्रशिक्षण से पहले 1000-विशेषता डेटासेट को उसके 50 सबसे सूचनापूर्ण दिशाओं तक सिकोड़ें, शोर और गणना कम। यह दृश्यीकरण (2-D पर प्रक्षेप), विशेषता विश्लेषण, और श्वेतीकरण चलाता। वही आइगेन/SVD चित्र आधुनिक निरूपण शिक्षण के अंतर्गत, दिशाओं का एक छोटा समुच्चय खोजत जो संरचना का अधिकांश पकड़ते।
▶ SVD द्वारा PCA
← SVDन्यूनतम वर्ग →