एन्ट्रॉपी — संभावना · Mathematics for Machine Learning

एन्ट्रॉपी अनिश्चितता मापता: आप एक यादृच्छिक परिणाम से कितनी आश्चर्यकता अपेक्षित। एक निष्पक्ष सिक्का अधिकतम अनिश्चित; एक दो-मुँहा सिक्का कोई आश्चर्य नहीं। क्लॉड शैनन ने इसे एक संख्या में, अपेक्षित आश्चर्य, जहाँ एक दुर्लभ घटना की आश्चर्यकता −log p(x) (दुर्लभ अधिक आश्चर्यजनक)।

log₂ एन्ट्रॉपी बिट्स में, परिणाम तय करने के लिए औसत हाँ/ना प्रश्नों की संख्या। एन्ट्रॉपी अधिकतम जब वितरण समान (हर परिणाम समान, अधिकतम भ्रम) और शून्य जब एक परिणाम निश्चित (कोई आश्चर्य नहीं)।

आकृति एक पक्षपाती सिक्के की एन्ट्रॉपी, H(p) = −p log₂ p − (1−p) log₂(1−p)। p खींचें: एन्ट्रॉपी p = 0.5 पर शिखर (1 पूर्ण बिट, एक वास्तविक सिक्का) और निश्चित सिरों पर 0।

ML में इसका स्थानएन्ट्रॉपी लगभग हर वर्गीकरण हानि का जनक। यह हानिरहित संपीड़न के लिए फर्श और क्रॉस-एन्ट्रॉपी (अगला पाठ) का लंगर, मानक प्रशिक्षण हानि। RL और अन्वेषण में, एक एन्ट्रॉपी बोनस उद्देश्य में जोड़ा ताकि नीति जल्दी ध्वस्त न हो: एन्ट्रॉपी अधिकतम का मतलब "अनिश्चित रहें, अन्वेषण जारी रखें।" निर्णय वृक्ष उस विशेषता पर विभाजित जो एन्ट्रॉपी सबसे अधिक घटाती (सूचना लाभ)।