رهانان يمكن أن يتشاركا نفس المتوسط ويشعرا بأنهما مختلفان تمامًا: "+1 أو −1" مقابل "+1000 أو −1000" كلاهما متوسطه 0، لكن أحدهما جامح. التباين يقيس ذلك التشتت، أي متوسط مربع المسافة بين X ومتوسطه μ = E[X]:
التربيع يبقي الانحرافات موجبة (كي لا يلغي بعضها بعضًا) ويعاقب الانحرافات الكبيرة بشدة أكبر. للعودة إلى الوحدات الأصلية، خذ الجذر التربيعي: الانحراف المعياري σ = √Var(X).
في الممارسة العملية تكون صيغة الاختصار أسرع، "متوسط المربّع ناقص مربّع المتوسط":
أين يظهر هذا في تعلّم الآلةإن تباين مقدّر التدرّج يحدد مدى ضوضاء كل خطوة تدريب. تدرّج الدفعة الصغيرة هو متوسط تدرّجات لكل مثال؛ وفقًا لبيانيميه، فإن حساب متوسط n من التقديرات المستقلة يقسم التباين على n، فتنخفض الضوضاء مثل 1/√n في الانحراف المعياري. هذا هو كامل سبب إعطاء الدفعات الأكبر خطوات أنعم وأقل تباينًا، وسبب تسريع حيل تقليل التباين للتدريب.