样本空间与事件

不确定性的数学

概率的起点,是承认你不知道接下来会发生什么。一枚硬币即将被抛出,一个骰子即将被掷出,一张图像即将被分类。在结果出现之前,你先列出它可能出现的每一种结果。这个可能结果的完整列表就是样本空间,记作 Ω(大写 omega)。

对一枚硬币,Ω = {H, T}。对一个骰子,Ω = {1, 2, 3, 4, 5, 6}。每个元素都是一个结果,也就是实验之后世界可能处于的一种完整且互斥的状态。

想象一下从洗好的一副牌中抽出一张牌。在你看之前,你会列出它可能是的每一张牌:全部 52 张。整个列表就是样本空间,这与为一个骰子写出 Ω = {1, 2, 3, 4, 5, 6} 的想法相同。“这张牌是红心”就是一个事件,它是该列表中包含 13 张牌的子集。

在机器学习中的应用当图像分类器从 Ω = {cat, dog, bird, …} 中选择时,这个标签列表就是离散样本空间,而像“真实标签是不是哺乳动物?”这样的问题就是一个事件,也就是类别的子集。数据增强也是同类随机实验:每次裁剪、翻转或颜色扰动都是从可能变换空间中抽取的一个结果,而增强数据集就是从其中得到的样本。
▶ 样本空间与事件
← 变量替换概率公理 →