標本空間と事象

不確実性の数学

確率は何が起きるか分からないと認めることから始まる。コインが投げられようとし、サイコロが振られようとし、画像が分類されようとしている。それが着地する前に、起こりうるすべての結果をリストする。その可能な結果の完全なリストが標本空間で、Ω(大文字オメガ)と書く。

1枚のコインについて、Ω = {H, T}。1つのサイコロについて、Ω = {1, 2, 3, 4, 5, 6}。各要素は1つの結果で、実験後の世界の完全で相互に排他的な1つのあり方です。

シャッフルされたカードの山から1枚のカードを引くことを考えてみてください。見る前に、あり得るすべてのカードをリストアップすると、全部で52枚になります。そのリスト全体が標本空間であり、サイコロについてΩ = {1, 2, 3, 4, 5, 6}と書くのと同じ考え方です。「カードがハートである」というのは事象であり、そのリストの13枚のカードからなる部分集合となります。

機械学習における位置づけ画像分類器がΩ = {cat, dog, bird, …}から選ぶとき、そのラベルリストは離散標本空間で、「真のラベルは哺乳類か?」のような問いは事象、クラスの部分集合です。データ拡張は同じ種類のランダム実験です:各クロップ、フリップ、色ジッターは可能な変換の空間から引かれた1つの結果で、拡張データセットはそこからの標本です。
▶ 標本空間と事象
← 変数変換確率の公理 →