跳转至

對角化

特徵子空間

矩陣 \(A\) 的屬於 \(\lambda_0\) 的全部特徵向量,再添上零向量,構成一個線性空間,稱為矩陣 \(A\) 的一個特徵子空間,記為 \(E(\lambda_0)\)。它是齊次線性方程組:

\[ (\lambda_0 I-A)X=0 \]

的解空間。

對於特徵子空間 \(E(\lambda_i)=N(\lambda_i I-A)\),由虧加秩定理有:

\[ r(\lambda_i I-A)+\operatorname{dim} N(\lambda_i I-A)=n \]

因此,特徵子空間 \(E(\lambda_i)\) 的維數為:

\[ \operatorname{dim} E(\lambda_i)=n-r(\lambda_i I-A) \]

也稱為 \(\lambda_i\)幾何重數

不變子空間

在研究線性變換 \(T\) 的時候,常常希望選取空間 \(V\) 的一個基,使得線性變換 \(T\) 對於這個基的矩陣具有儘可能簡單的形狀。

\(V\) 是數域 \(F\) 上的線性空間,\(W\)\(V\) 的一個子空間,\(T\)\(V\) 上的一個線性變換。如果對於 \(W\) 中任意的向量 \(x\),都有 \(T(x)\) 也在 \(W\) 中(也稱為空間在變換下不變或穩定),稱 \(W\)\(T\) 的一個不變子空間。

空間在變換下不變,並不是説座標在變換下真的「不變」,有可能是進行了一個拉伸等變形,只是變形後還落在空間裏。

  • 線性空間 \(V\) 的任意一個子空間都是數乘變換的不變子空間。
  • 對於 \(V\) 中任意的線性變換 \(T\),空間 \(V\) 和零子空間都是 \(T\) 的不變子空間,稱為平凡不變子空間。
  • 不變子空間的交與和也是不變子空間。

\(W\) 是線性變換 \(T\) 的一個不變子空間。只考慮 \(T\) 在不變子空間 \(W\) 上的作用,就得到子空間 \(W\) 本身的線性變換,稱為 \(T\) 在子空間 \(W\) 上的限制,記作 \({T|}_W\)

對於 \(V\) 中任意的線性變換 \(T\),像空間 \(R(T)\) 與核空間 \(N(T)\)\(T\) 的不變子空間。這兩種情況的含義是,空間 \(V\) 在變換前後,完成了自身的壓縮(像空間),或者壓縮到 \(0\)(核空間)。

對於 \(V\) 中任意的線性變換 \(T\)\(T\) 的特徵子空間是 \(T\) 的不變子空間。

準素分解

根據代數基本定理,最小多項式可以分解為:

\[ m_A(\lambda)={(\lambda-\lambda_1)}^{r_1}\cdots{(\lambda-\lambda_S)}^{r_S} \]

考慮最小多項式代入變元 \(\lambda\) 為矩陣 \(A\) 後,各個因式的核空間,構成矩陣 \(A\) 的一系列不變子空間:

\[ W_i=N({(\lambda_i I-A)}^{r_i}) \]

定理:該不變子空間 \(W_i\) 的維數,恰好為特徵值 \(\lambda_i\) 的代數重數。

回顧一下,代數重數是指特徵多項式各個因式的次數,幾何重數是指特徵子空間 \(E(\lambda_i)=N(\lambda_i I-A)\) 的維數。這個不變子空間 \(W_i\) 與特徵子空間 \(E(\lambda_i)\),兩者都是矩陣的核空間,並且兩個矩陣構成最小多項式 \(r_i\) 次冪的關係。也就是説,特徵子空間的維數是幾何重數,「特徵子空間」經過最小多項式 \(r_i\) 次冪後到達一個「不變子空間」,不變子空間的維數到達了特徵多項式的代數重數。

該定理其實是下面準素分解定理的推論。

記矩陣 \(A\) 對應的線性變換 \(T\),在每個子空間 \(W_i\) 上的限制 \(T_i={T|}_{W_i}\)。於是 \(T_i\) 的最小多項式是 \((x-\lambda_i)^{r_i}\)

定理:設 \(V\) 是域 \(F\) 上的線性空間,\(T\)\(V\) 上的一個線性變換。那麼空間 \(V\) 可以關於線性變換 \(T\) 進行準素分解,拆成若干不變子空間 \(W_i\) 的直和。

\[ V=W_1\oplus W_2\oplus\cdots\oplus W_S \]

這意味着,\(T\) 在某組基下的矩陣是準對角陣:

\[ \operatorname{diag}\{A_1,A_2,\cdots,A_S\} \]

其中,\(A_i\)\(T_i\) 在對應基下的矩陣。

該定理表明,可以使用不變子空間簡化線性變換的矩陣。

可對角化矩陣

對於 \(n\) 階方陣 \(A\),如果相似於一個對角陣,則稱 \(A\) 為可對角化矩陣,或稱單純矩陣。

  • 對角陣的和、積、逆,如果存在,仍然是對角陣,其對角線上的元素就是它的特徵值。
  • 線性變換 \(T\) 的矩陣為可對角化矩陣,等價於 \(T\) 在某組基下的矩陣為對角陣。

定理:設矩陣 \(A\) 的全部互異特徵根為 \(\lambda_1,\cdots,\lambda_m\),則以下命題等價:

  • 矩陣 \(A\) 可對角化。
  • 矩陣 \(A\)\(n\) 個線性無關的特徵向量。
  • 以下公式成立:
\[ \operatorname{dim} E(\lambda_1)+\cdots+\operatorname{dim} E(\lambda_m)=n \]

前文已經指出,特徵多項式的分解式中特徵值的次數稱為代數重數,特徵子空間的維數稱為幾何重數。這個定理也表明,矩陣 \(A\) 可對角化,等價於 \(A\) 的每個特徵值 \(\lambda\) 的代數重數都等於它的幾何重數。

推論:如果 \(n\) 階方陣 \(A\) 恰有 \(n\) 個互異特徵值,則它必可對角化。反之則不一定。

定理:矩陣 \(A\) 可對角化當且僅當 \(A\) 的最小多項式沒有重根。

矩陣的相似也會保持特徵向量之間的線性相關關係不變。

特徵向量完全可能不是實數,也完全可能找不到 \(n\) 個線性無關的特徵向量。

對於重特徵值而言,特徵向量張成空間。為了描述這個空間,需要從其中選擇代表。一般會選擇線性無關的代表,代表的個數就是空間的維數。

選取代表時,常常將它們正交化與單位化。最終得到的就是一套單位正交的代表。

特徵向量不一定正交,不同特徵值的特徵向量,可能無法正交。因此正交化只能對於重特徵值的特徵向量進行。但是單位化可以對任意特徵向量進行。

冪零矩陣

\(T\) 是空間 \(V\) 的一個線性變換。如果存在一個正整數 \(r\),使得 \(T^r\) 為零變換,稱 \(T\) 是空間 \(V\) 的一個冪零變換。

對於某一個正整數 \(r\),滿足條件 \(N^r=0\) 的矩陣稱為冪零矩陣。

一般可以進一步假定 \(r\) 是使 \(T^r\) 為零變換的最小正整數,於是 \(T\) 的最小多項式是 \(x^r\)。於是存在一個向量 \(\xi_0\),使得:

  • \[ T^r(\xi_0)=0 \]
  • \[ T^{r-1}(\xi_0)\neq 0 \]

循環子空間

定理:設 \(T\) 是空間 \(V\) 的一個線性變換,\(\xi\) 是空間 \(V\) 的一個向量。如果存在一個正整數 \(s\),使得:

  • \[ T^s(\xi)=0 \]
  • \[ T^{s-1}(\xi)\neq 0 \]

那麼向量 \(\xi,T(\xi),\cdots,T^{s-1}(\xi)\) 線性無關。

由這個定理可以給出一個定義:

\(T\) 是空間 \(V\) 的一個線性變換,\(W\)\(V\) 的一個子空間。如果存在一個向量 \(\xi_0\) 和一個正整數 \(r\),使得:

  • 向量 \(\xi_0,T(\xi_0),\cdots,T^{r-1}(\xi_0)\) 構成 \(W\) 的一個基。
  • 如下等式成立:

    \[ T^r(\xi_0)=0 \]

那麼子空間 \(W\) 稱為關於 \(T\) 的一個循環子空間,簡稱 \(T\) 循環子空間。此時 \(\xi_0\) 稱為循環子空間 \(W\) 的一個生成向量,向量 \(\xi_0,T(\xi_0),\cdots,T^{r-1}(\xi_0)\) 稱為 \(W\) 的一個循環基。

顯然,一個 \(T\) 循環子空間 \(W\)\(T\) 作用下不變,並且對於循環子空間 \(W\) 中的任意向量 \(\xi\),均有 \(T^r(\xi)=0\),這裏 \(r\) 為循環子空間的維數。

冪零 Jordan 塊

如果空間 \(W\) 是變換 \(T\) 的循環子空間,那麼 \(T\)\(W\) 上的限制 \({T|}_W\)\(W\) 的一個冪零變換,並且 \({T|}_W\) 關於 \(W\) 的倒序排列的循環基 \(T^{r-1}(\xi_0),T^{r-2}(\xi_0),\cdots,\xi_0\) 的矩陣是如下形狀的 \(r\) 階上三角矩陣:

\[ N_r=\begin{pmatrix} 0 & 1 & 0 & \cdots & 0 & 0\\ 0 & 0 & 1 & \cdots & 0 & 0\\ 0 & 0 & 0 & \cdots & 0 & 0\\ \vdots & \vdots & \vdots & & \vdots& \vdots\\ 0 & 0 & 0 & \cdots & 0 & 1\\ 0 & 0 & 0 & \cdots & 0 & 0\\ \end{pmatrix} \]

矩陣 \(N_r\) 稱為一個 \(r\) 階冪零 Jordan 矩陣,或者 \(r\) 階冪零 Jordan 塊。

\(T\)\(n\) 維空間 \(V\) 的一個冪零變換,把出現在 \(V\) 關於 \(T\) 的循環子空間的分解中,唯一確定的一組正整數 \(r_1\geq\cdots\geq r_S\) 叫做 \(T\) 的不變指數。

對於 \(n\) 階冪零矩陣 \(A\)\(A\) 與一個上述形狀的矩陣 \(N\) 相似,也唯一確定一個正整數序列 \(r_1\geq\cdots\geq r_S\),稱為矩陣 \(A\) 的不變指數。

冪零陣雖然不能和對角陣相似,但是可以相似於這樣的標準形式。在 Jordan 標準型,將相似對角化與冪零陣的標準形式,二者結合起來,給出一般的矩陣通過相似變換可以達到的標準形式。

一些定理

  1. \(T\) 是空間 \(V\) 的一個冪零變換,而

    \[ h(x)=a_0+a_1x+\cdots+a_mx^m \]

    是一個多項式,那麼當且僅當 \(a_0\neq 0\) 時,線性變換 \(h(T)\) 有逆變換。當 \(h(T)\) 可逆時,\(h(T)\) 的逆變換也是 \(T\) 的一個多項式。

  2. \(T\) 是空間 \(V\) 的一個冪零變換,\(W\) 是一個 \(r\)\(T\) 循環子空間,\(\xi\)\(W\) 中的向量。如果存在一個整數 \(k\),使得

    \[ T^{r-k}(\xi)=0 \]

    那麼存在 \(W\) 中的向量 \(\eta\),使得

    \[ \xi=T^k(\eta) \]
  3. \(T\)\(n\) 維空間 \(V\) 的一個冪零變換,\(x^r\)\(T\) 的最小多項式,令 \(W_1\) 是一個 \(r\)\(T\) 循環子空間,那麼存在 \(W_1\) 的一個餘子空間 \(W_2\),使得:

    \[ V=W_1\oplus W_2 \]

    並且 \(W_2\) 也在 \(T\) 作用下不變。

  4. \(T\)\(n\) 維空間 \(V\) 的一個冪零變換,那麼 \(V\) 可以分解為 \(T\) 循環子空間的直和:

    \[ V=W_1\oplus W_2\oplus\cdots\oplus W_S \]
  5. 每一個 \(n\) 階冪零矩陣都與一個形如:

    \[ N=\begin{pmatrix} N_{r_1} & & & 0\\ & N_{r_2} & & \\ & & \cdots & \\ 0 & & & N_{r_S}\\ \end{pmatrix} \]

    的矩陣相似,這裏的每一個 \(N_{r_i}\) 是一個 \(r_i\) 階冪零 Jordan 塊。

  6. 如果規定 \(T\) 循環子空間 \(W_i\) 按照維數 \(r_i\) 降序排列 \(r_1\geq\cdots\geq r_S\),那麼將 \(V\) 分解為 \(T\) 循環子空間的方法是由 \(T\) 唯一確定的。