跳转至

基本概念

概述

在研究具體的隨機現象時我們通常着重關注以下要素:

  • 樣本空間 \(\Omega\),指明隨機現象所有可能出現的結果。
  • 事件域 \(\mathcal{F}\),表示我們所關心的所有事件。
  • 概率 \(P\),描述每一個事件發生的可能性大小。

樣本空間、隨機事件

定義

一個隨機現象中可能發生的不能再細分的結果被稱為 樣本點。所有樣本點的集合稱為 樣本空間,通常用 \(\Omega\) 來表示。

一個 隨機事件 是樣本空間 \(\Omega\) 的子集,它由若干樣本點構成,用大寫字母 \(A, B, C, \cdots\) 表示。

對於一個隨機現象的結果 \(\omega\) 和一個隨機事件 \(A\),我們稱事件 \(A\) 發生了 當且僅當 \(\omega \in A\)

例如,擲一次骰子得到的點數是一個隨機現象,其樣本空間可以表示為 \(\Omega=\{1,2,3,4,5,6\}\)。設隨機事件 \(A\) 為「獲得的點數大於 \(4\)」,則 \(A = \{ 5, 6 \}\)。若某次擲骰子得到的點數 \(\omega = 3\),由於 \(\omega \notin A\),故事件 \(A\) 沒有發生。

事件的運算

由於我們將隨機事件定義為了樣本空間 \(\Omega\) 的子集,故我們可以將集合的運算(如交、並、補等)移植到隨機事件上。記號與集合運算保持一致。

特別的,事件的並 \(A \cup B\) 也可記作 \(A + B\),事件的交 \(A \cap B\) 也可記作 \(AB\),此時也可分別稱作 和事件積事件

事件域

研究具體的隨機現象時我們需要明確哪些事件是我們感興趣的。根據隨機事件的定義,顯然有 \(\mathcal{F} \subset 2^{\Omega}\)(記號 \(2^{\Omega}\) 表示由 \(\Omega\) 的所有子集組成的集合族),但 \(\mathcal{F} = 2^{\Omega}\) 卻不是必須的。這在樣本空間 \(\Omega\) 有限時可能有些難以理解,畢竟 \(2^{\Omega}\) 儘管更大了但仍然有限。而當 \(\Omega\) 為無窮集時,\(2^{\Omega}\) 的勢變得更大,其中也難免會出現一些「性質不太好」且我們不關心的事件,這時為了兼顧這些事件而放棄一些性質就顯得得不償失了。

儘管 \(\mathcal{F} = 2^{\Omega}\) 不是必須的,這並不代表 \(2^{\Omega}\) 的任一子集都能成為事件域。我們通常會對一些事件進行運算得到的結果事件的概率感興趣,因此我們希望事件域 \(\mathcal{F}\) 滿足下列條件:

  • \(\varnothing \in \mathcal{F}\)
  • \(A \in \mathcal{F}\),則補事件 \(\bar{A} \in \mathcal{F}\)
  • 若有一列事件 \(A_n \in \mathcal{F}, n = 1, 2, 3\dots\),則 \(\bigcup A_n \in \mathcal{F}\)

簡言之,就是事件域 \(\mathcal{F}\) 對在補運算、和可數並下是封閉的,且包含元素 \(\varnothing\)

可以證明滿足上述三個條件的事件域 \(\mathcal{F}\) 對可數交也是封閉的。

以擲骰子為例,當樣本空間記為 \(\Omega=\{1,2,3,4,5,6\}\) 時,以下兩個集合能夠成為事件域:

  • \(\mathcal{F}_1 = \{ \varnothing, \Omega \}\)
  • \(\mathcal{F}_2 = \{ \varnothing, \{1, 3, 5\}, \{2, 4, 6\}, \Omega \}\)

但以下兩個集合則不能

  • \(\mathcal{F}_3 = \{ \varnothing, \{1\}, \Omega \}\)(對補不封閉)
  • \(\mathcal{F}_4 = \{ \{1, 3, 5\}, \{2, 4, 6\} \}\)(不含有 \(\varnothing\) 且對並不封閉)

概率

定義

古典定義

在概率論早期實踐中,由於涉及到的隨機現象都比較簡單,具體表現為樣本空間 \(\Omega\) 是有限集,且直觀上所有樣本點是等可能出現的,因此人們便總結出了下述定義:

如果一個隨機現象滿足:

  • 只有有限個基本結果;
  • 每個基本結果出現的可能性是一樣的;

那麼對於每個事件 \(A\),定義它的概率為

\[ P(A)=\frac{\#(A)}{\#(\Omega)} \]

其中 \(\#(\cdot)\) 表示對隨機事件(一個集合)大小的度量。

後來人們發現這一定義可以直接推廣到 \(\Omega\) 無限的一部分情景中,於是就有了所謂 幾何概型

公理化定義

上述基於直觀認識的定義在邏輯上有一個很大的漏洞:在定義「概率」這一概念時用到了「可能性」這一説法,產生了循環定義的問題。同時「等可能」在樣本空間無限時會產生歧義,由此產生了包括 Bertrand 悖論 在內的一系列問題。

經過不斷探索,蘇聯數學家柯爾莫哥洛夫於 1933 年在他的《概率論基礎》一書中第一次給出了概率的公理化定義:

概率函數 \(P\) 是一個從事件域 \(\mathcal{F}\) 到閉區間 \([0, 1]\) 的映射,且滿足:

  • 規範性:事件 \(\Omega\) 的概率值為 \(1\),即 \(P(\Omega)=1\)
  • 可數可加性:若一列事件 \(A_1, A_2, \cdots\) 兩兩不交,則 \(P\left( \bigcup_{i \geq 1} A_i \right) = \sum_{i \geq 1} P(A_i)\)

概率函數的性質

對於任意隨機事件 \(A, B \in \mathcal{F}\),有

  • 單調性:若 \(A \subset B\),則有 \(P(A) \leq P(B)\)
  • 容斥原理\(P(A+B) = P(A) + P(B) - P(AB)\)
  • \(P(A - B) = P(A) - P(AB)\),這裏 \(A - B\) 表示差集。

概率空間

我們在一開始提到,研究具體的隨機現象時我們通常關注樣本空間 \(\Omega\)、事件域 \(\mathcal{F}\) 以及概率函數 \(P\)。我們將三元組 \((\Omega, \mathcal{F}, P)\) 稱為一個概率空間。

概率只有在確定的概率空間下討論才有意義。我們前面提到的 Bertrand 悖論歸根結底就是因對樣本空間 \(\Omega\) 的定義不明確而產生的。

參考資料與註釋