跳转至

條件概率與獨立性

概述

當某事件已經發生時,一些隨機事件的概率會因為已知信息的增加發生變化。例如在手遊抽卡時,我們可能會認為單次抽卡出六星與不出六星是等概率的,但隨着我們連抽 \(50\) 發一個六星都沒有,再固執地認為「出六星與不出六星等概率」就顯得不是那麼明智。

總之,研究在某些已知條件下事件發生的概率是必要的。

條件概率

定義

若已知事件 \(A\) 發生,在此條件下事件 \(B\) 發生的概率稱為 條件概率,記作 \(P(B|A)\)

在概率空間 \((\Omega, \mathcal{F}, P)\) 中,若事件 \(A \in \mathcal{F}\) 滿足 \(P(A) > 0\),則條件概率 \(P(\cdot|A)\) 定義為

\[ P(B|A) = \frac{P(AB)}{P(A)} \quad \forall B \in \mathcal{F} \]

可以驗證根據上式定義出的 \(P(\cdot|A)\)\((\Omega, \mathcal{F})\) 上的概率函數。

根據條件概率的定義可以直接推出下面兩個等式:

  • 概率乘法公式:在概率空間 \((\Omega, \mathcal{F}, P)\) 中,若 \(P(A) > 0\),則對任意事件 \(B\) 都有
\[ P(AB) = P(A)P(B|A) \]
  • 全概率公式:在概率空間 \((\Omega, \mathcal{F}, P)\) 中,若一組事件 \(A_1, \cdots, A_n\) 兩兩不交且和為 \(\Omega\),則對任意事件 \(B\) 都有
\[ P(B) = \sum_{i=1}^{n} P(A_i)P(B|A_i) \]

Bayes 公式

一般來説,設可能導致事件 \(B\) 發生的原因為 \(A_1, A_2, \cdots, A_n\),則在 \(P(A_i)\)\(P(B|A_i)\) 已知時可以通過全概率公式計算事件 \(B\) 發生的概率。但在很多情況下,我們需要根據「事件 \(B\) 發生」這一結果反推其各個原因事件的發生概率。於是有

\[ P(A_i|B) = \frac{P(A_iB)}{P(B)} = \frac{P(A_i)P(B|A_i)}{\sum_{j=1}^{n} P(A_j)P(B|A_j)} \]

上式即 Bayes 公式。

事件的獨立性

在研究條件概率的過程中,可能會出現 \(P(B|A) = P(B)\) 的情況。從直觀上講就是事件 \(B\) 是否發生並不會告訴我們關於事件 \(A\) 的任何信息,即事件 \(B\) 與事件 \(A\)「無關」。於是我們就有了下面的定義

定義

若同一概率空間中的事件 \(A\),\(B\) 滿足

\[ P(AB) = P(A)P(B) \]

則稱 \(A\),\(B\) 獨立。對於多個事件 \(A_1, A_2, \cdots, A_n\),我們稱其獨立,當且僅當對任意一組事件 \(\{ A_{i_k} : 1 \leq i_1 < i_2 < \cdots < i_k \leq n \}\) 都有

\[ P( A_{i_1}A_{i_2} \cdots A_{i_r} ) = \prod_{k=1}^{r} P(A_{i_k}) \]

多個事件的獨立性

對於多個事件,一般不能從兩兩獨立推出這些事件獨立。考慮以下反例:

有一個正四面體骰子,其中三面被分別塗成紅色、綠色、藍色,另一面則三色皆有。現在扔一次該骰子,令事件 \(A\),\(B\),\(C\) 分別表示與桌面接觸的一面包含紅色、綠色、藍色。

不難計算 \(P(A) = P(B) = P(C) = \frac{1}{2}\),而 \(P(AB) = P(BC) = P(CA) = P(ABC) = \frac{1}{4}\)

顯然 \(A, B, C\) 兩兩獨立,但由於 \(P(ABC) \neq P(A)P(B)P(C)\),故 \(A, B, C\) 不獨立。