跳转至

隨機變量

相關概念

隨機變量

給定概率空間 \((\Omega, \mathcal{F}, P)\),定義在樣本空間 \(\Omega\) 上的函數 \(X : \Omega \to \mathbb{R}\) 若滿足:對任意 \(t \in \mathbb{R}\) 都有

\[ \{ \omega \in \Omega : X(\omega) \le t \} \in \mathcal{F} \]

則稱 \(X\)隨機變量

示性函數

對於樣本空間 \(\Omega\) 上的事件 \(A\),定義隨機變量

\[ I_A(\omega) = \begin{cases} 1, & \omega \in A \\ 0, & \omega \notin A \end{cases} \]

\(I_A\) 是事件 \(A\)示性函數

分佈函數

對於隨機變量 \(X\),稱函數

\[ F(x) = P( X \leq x ) \]

為隨機變量 \(X\)分佈函數。記作 \(X \sim F(x)\)

分佈函數具有以下性質:

  • 右連續性\(F(x) = F(x + 0)\)
  • 單調性:在 \(\mathbb{R}\) 上單調遞增(非嚴格)
  • \(F(-\infty) = 0\),\(F(+\infty) = 1\)

同時我們可以證明,滿足上述要求的函數都是某個隨機變量的分佈函數。因此,分佈函數與隨機變量之間一一對應。

隨機變量的分類

隨機變量按其值域(根據定義,隨機變量是一個函數)是否可數分為 離散型連續型 兩種。

離散型隨機變量

\(X\) 為離散型隨機變量,其所有可能的取值為 \(x_1, x_2, \cdots\),則我們可以用一系列形如 \(P\{ X = x_i \} = p_i\) 的等式來描述 \(X\)。這就是我們在高中課本中學過的 分佈列

連續型隨機變量

\(X\) 為連續型隨機變量,考察 \(P\{ X = x \}\) 往往是無意義的(因為這一概率很可能是 \(0\))。

為什麼説概率「很可能」是 \(0\)

考慮這樣的隨機變量 \(X\):它以 \(\frac{1}{2}\) 的概率取 \(0\),以 \(\frac{1}{2}\) 的概率服從開區間 \((0, 1)\) 上的均勻分佈。顯然 \(X\) 滿足連續型隨機變量的定義。

對任何實數 \(r \in (0, 1)\),不難得到 \(P\{ X = r \} = 0\),但同時有 \(P\{ X = 0 \} = \frac{1}{2}\)

另一方面,設 \(X \sim F(x)\),則

\[ P( l < x \leq l + \Delta x ) = F(l + \Delta x) - F(l) \]

一個自然的想法是用極限 \(\lim\limits_{\Delta x \to 0^+} \frac{F(l + \Delta x) - F(l)}{\Delta x}\) 來描述 \(X\) 取值為 \(l\) 的可能性。

這個式子就是我們熟知的導數,於是問題轉化為尋找一個非負函數 \(f(x)\) 使得

\[ F(x) = \int_{-\infty}^{x} f(x) \text{d} x \]

若這樣的 \(f(x)\) 存在,則稱之為 \(X\)密度函數

隨機變量的獨立性

前面討論了隨機事件的獨立性。由於隨機變量和隨機事件緊密聯繫,我們還可以類似地給出隨機變量獨立性的定義。

定義

若隨機變量 \(X, Y\) 滿足對任意的 \(x, y \in \mathbb{R}\) 都有

\[ P( X \leq x, Y \leq y ) = P( X \leq x ) P( Y \leq y ) \]

則稱隨機變量 \(X, Y\) 獨立

Note

有些同學也許會注意到,中學課本中對隨機變量獨立性的定義是用形如 \(P(X = \alpha)\) 的概率定義的,但由於連續性隨機變量取特定值的概率通常是 \(0\),故在更一般的情形下藉助分佈函數定義才是更加明智的選擇。

性質

若隨機變量 \(X\),\(Y\) 相互獨立,則對於任意函數 \(f, g\),隨機變量 \(f(X)\)\(g(Y)\) 相互獨立。

Warning

有時候我們會研究相互獨立的隨機變量 \(X\),\(Y\) 的某一函數 \(f(X, Y)\)(如 \(XY^2\))的分佈。

儘管 \(X\)\(Y\) 是獨立的,但不能想當然地認為對 \(Y\) 的某一取值 \(y\)\(f(X, y)\)\(f(X, Y)\) 服從同樣的分佈。