样本空间与事件

不确定性的数学

概率的起点，是承认你不知道接下来会发生什么。一枚硬币即将被抛出，一个骰子即将被掷出，一张图像即将被分类。在结果出现之前，你先列出它可能出现的每一种结果。这个可能结果的完整列表就是样本空间，记作 Ω（大写 omega）。

对一枚硬币，Ω = {H, T}。对一个骰子，Ω = {1, 2, 3, 4, 5, 6}。每个元素都是一个结果，也就是实验之后世界可能处于的一种完整且互斥的状态。

想象一下从洗好的一副牌中抽出一张牌。在你看之前，你会列出它可能是的每一张牌：全部 52 张。整个列表就是样本空间，这与为一个骰子写出 Ω = {1, 2, 3, 4, 5, 6} 的想法相同。“这张牌是红心”就是一个事件，它是该列表中包含 13 张牌的子集。

在机器学习中的应用当图像分类器从 Ω = {cat, dog, bird, …} 中选择时，这个标签列表就是离散样本空间，而像“真实标签是不是哺乳动物？”这样的问题就是一个事件，也就是类别的子集。数据增强也是同类随机实验：每次裁剪、翻转或颜色扰动都是从可能变换空间中抽取的一个结果，而增强数据集就是从其中得到的样本。

▶ 样本空间与事件

← 变量替换概率公理 →