跳转至

Jordan標準型

Jordan 分解

\(T\)\(n\) 維空間 \(V\) 上的一個線性變換。如果 \(T\) 的最小多項式為:

\[ m_A(\lambda)={(\lambda-\lambda_1)}^{r_1}{(\lambda-\lambda_2)}^{r_2}\cdots{(\lambda-\lambda_k)}^{r_k} \]

那麼由準素分解可知,空間 \(V\) 可以分解為子空間的直和:

\[ V=V_1\oplus V_2\oplus\cdots\oplus V_k \]

其中 \(V_i=N\left({(A-\lambda_i I)}^{r_i}\right)\),式中 \(A\)\(T\) 對應的矩陣,這些子空間都在 \(T\) 作用下不變。

令變換 \(T_i\)\(V\) 在子空間 \(V_i\) 上的射影,即構造多項式 \(u_i(T)\) 使得:

  • \[ T_i=u_i(T)\frac{m_A(T)}{{(T-\lambda_i T_e)}^{r_i}} \]
  • \[ T_1+T_2+\cdots+T_k=T_e \]

式中 \(T_e\) 表示空間 \(V\) 的恆等變換。於是有性質:

  • 變換 \(T_i\) 在空間 \(V_i\) 上的限制 \({T_i|}_{V_i}\) 為空間 \(V_i\) 的恆等變換。
  • 如果 \(i\)\(j\) 不相等,變換 \(T_i\) 在空間 \(V_j\) 上的限制 \({T_i|}_{V_j}\) 為空間 \(V_j\) 的零變換。

於是變換 \(T_i\) 將空間 \(V\) 的每一個向量 \(\xi\) 映射為它在空間 \(V_i\) 中的分量 \(\xi_i\)

構造變換:

\[ T_D=\lambda_1 T_1+\lambda_2 T_2+\cdots+\lambda_k T_k \]

由於每一個變換 \(T_i\) 都是變換 \(T\) 的一個多項式,所以變換 \(T_D\) 也是變換 \(T\) 的一個多項式,於是每一個子空間 \(V_i\) 在變換 \(T_D\) 下不變。

由上述等式可知,變換 \(T_D\) 在子空間 \(V_i\) 上的限制 \({T_D|}_{V_i}\) 是子空間 \(V_i\) 的一個位似,位似係數為 \(\lambda_i\)。因此,變換 \(T_D\) 可以對角化。

構造:

\[ T_N=T-T_D \]

於是變換 \(T_N\) 也是變換 \(T\) 的一個多項式,所以每一個子空間 \(V_i\) 在變換 \(T_N\) 下不變。對於子空間 \(V_i\) 中的任意向量 \(\xi_i\),有:

\[ {T_N}^{r_i}(\xi_i)={T-T_D}^{r_i}(\xi_i)={T-\lambda_i T_i}^{r_i}(\xi_i)=0 \]

\(r\) 為全體 \(r_i\) 的最大值,那麼對於空間 \(V\) 中的任意向量 \(\xi\),變換 \(T_N\)\(r\) 次方將向量 \(\xi\) 映射至零向量。因此變換 \(T_N\) 是一個冪零變換。

這樣,空間 \(V\) 的每一個變換 \(T\) 都可以寫成:

\[ T=T_D+T_N \]

其中 \(T_D\) 可以對角化,而 \(T_N\) 是一個冪零變換。因為 \(T_D\)\(T_N\) 都是變換 \(T\) 的多項式,所以它們的乘積可交換:

\[ T_DT_N=T_NT_D \]

定理:設 \(T_1\)\(T_2\) 是空間 \(V\) 的兩個可對角化變換,且 \(T_1T_2=T_2T_1\),那麼存在一個基,使得 \(T_1\)\(T_2\) 關於這同一個基的矩陣是對角形式。

定理:設 \(T\)\(n\) 維空間 \(V\) 上的一個線性變換,那麼存在一個可對角化變換 \(T_D\) 和一個冪零變換 \(T_N\),使得:

  • \[ T=T_D+T_N \]
  • \[ T_DT_N=T_NT_D \]

它們都是變換 \(T\) 的多項式,並且它們由變換 \(T\) 唯一確定。

該定理給出關於變換 \(T\) 的分解,稱為 \(T\) 的若爾當(Jordan)分解,\(T_D\) 叫做 \(T\) 的可對角化部分,\(T_N\) 叫做 \(T\) 的冪零部分。

同樣地,有矩陣的 Jordan 分解:

定理:設 \(A\) 是一個 \(n\) 階矩陣,那麼存在一個可對角化矩陣 \(D\) 和一個冪零矩陣 \(N\),使得:

  • \[ A=D+N \]
  • \[ DN=ND \]

它們都是矩陣 \(A\) 的多項式,並且它們由矩陣 \(A\) 唯一確定。

該定理給出關於矩陣 \(A\) 的分解,稱為 \(A\) 的若爾當(Jordan)分解,\(D\) 叫做 \(A\) 的可對角化部分,\(N\) 叫做 \(A\) 的冪零部分。

lambda 矩陣

接下來引入的部分是含有變元參量 \(\lambda\) 的更廣義的矩陣,不僅僅是一個數表。這部分討論相較單純由數構成的矩陣而言,更加廣泛一些。

對於 \(\lambda\) 矩陣,對應空間相應的域,變為含有一個變元 \(\lambda\) 的有理式域。

\(\lambda\) 的多項式為元素的矩陣稱為 \(\lambda\) 矩陣,記為 \(A(\lambda)\)

由於多項式域包含數域,數字矩陣是特殊的 \(\lambda\) 矩陣,數字矩陣 \(A\) 的特徵矩陣 \(\lambda I-A\) 是一種 \(\lambda\) 矩陣。

lambda 矩陣的初等變換

對於 \(\lambda\) 矩陣,同樣可以定義加減法、乘法、初等變換、秩。對於 \(\lambda\) 方陣,同樣可以定義行列式、餘子式、代數餘子式。

對於 \(\lambda\) 矩陣,初等變換與數陣大多相同,僅將倍加變換改為(這裏以行變換為例):

  • \(\lambda\) 的多項式 \(\varphi(\lambda)\) 乘某行並加到另一行上。

注意倍乘變換不進行修改。這是因為倍加變換不改變行列式,而倍乘變換改變行列式。為了保持多項式域的秩的性質,行列式只能在數域上進行改變。

相應的初等矩陣也一併進行修改。

易見三種初等陣的行列式均為非零常數,因此均為滿秩。所以它們左乘或右乘,不改變 \(\lambda\) 矩陣的秩。

\(A(\lambda)\) 經過有限次初等變換變為 \(B(\lambda)\),則稱 \(A(\lambda)\)\(B(\lambda)\) 等價。

對於 \(\lambda\) 矩陣,如果等價,則秩相同。反之則不然,這與數字矩陣有區別。

Smith 標準型

定理:設 \(\lambda\) 矩陣的秩是 \(r\),則 \(A(\lambda)\) 一定等價於:

\[ \begin{pmatrix} D(\lambda) & 0\\ 0 & 0\\ \end{pmatrix} \]

其中:

\[ D(\lambda)=\begin{pmatrix} d_1(\lambda) & & \\ & \ddots & \\ & & d_r(\lambda)\\ \end{pmatrix} \]

每一個 \(d_i(\lambda)\) 是一個首 \(1\) 多項式,並且相鄰兩個多項式有整除關係 \(d_i(\lambda)|d_{i+1}(\lambda)\)

稱此標準型為 Smith 標準型,稱 \(d_i(\lambda)\) 為不變因子。

具體求解 Smith 標準型的辦法是,從左上角到右下角進行消元,每次左上角的元素是右下方剩餘的全體多項式的最大公因式,並藉助左上角的元素將該行該列全部消為 \(0\)

定理:條件 \(A(\lambda)\)\(B(\lambda)\) 等價,等價於條件 \(A(\lambda)\)\(B(\lambda)\) 擁有完全一樣的不變因子。

初等因子

由代數基本定理,設 \(A(\lambda)\) 的不變因子 \(d_1(\lambda),d_2(\lambda),\cdots,d_m(\lambda)\) 的分解為:

\[ d_i(\lambda)={(\lambda-\lambda_1)}^{e_{i1}}{(\lambda-\lambda_2)}^{e_{i2}}\cdots{(\lambda-\lambda_S)}^{e_{iS}} \]

其中 \(\lambda_1,\cdots,\lambda_S\) 互不相同。由於:

\[ d_i(\lambda)|d_{i+1}(\lambda) \]

因此指數 \(e_{1j},e_{2j},\cdots,e_{mj}\) 遞增,並且最後一項 \(d_m(\lambda)\) 的各項指數均非零。

上式中指數大於零的全部因子,統稱為 \(A(\lambda)\) 的初等因子。

注意,初等因子計重數。如果對於某個 \(j\),指數 \(e_{ij}\) 出現了若干次,則對應的初等因子 \({(\lambda-\lambda_j)}^{e_{ij}}\) 也應當出現相應次數。

之前的定理説明,\(A(\lambda)\)\(B(\lambda)\) 等價,等價於他們兩個擁有完全一致的不變因子。不變因子完全相同,自然初等因子也完全相同,但是反之則不然。事實上有結論:

定理:\(A(\lambda)\)\(B(\lambda)\) 不變因子完全相同,等價於初等因子和秩均完全相同。

於是「初等因子和秩均完全相同」也成為判斷 \(\lambda\) 矩陣等價性的條件。

在初等變換的時候,也可以先將 \(A(\lambda)\) 變換為對角陣,再求出初等因子和秩,再求出不變因子得到標準型。有結論:

定理:設 \(A(\lambda)\) 等價於對角陣:

\[ \operatorname{diag}\{f_1(\lambda),f_2(\lambda),\cdots,f_r(\lambda),0,\cdots,0\} \]

那麼有 \(f_1(\lambda),f_2(\lambda),\cdots,f_r(\lambda)\) 的全體一次因子的冪 \({(\lambda-\lambda_j)}^{e_{ij}}\),構成 \(A(\lambda)\) 的初等因子。

由初等因子和秩構造不變因子的具體方法為:先將初等因子按照因式分類,排成表格,把同類因式進行降冪排列放到同一行,各類因式的最高次冪放到一列,把列數用 \(1\) 補齊至秩 \(r\),那麼每一列的乘積構成一個不變因子。

在特徵矩陣中的應用

如果 \(A\)\(B\) 是數陣,那麼它們的特徵矩陣是 \(\lambda\) 矩陣。有結論:

定理:條件數陣 \(A\)\(B\) 相似,等價於條件特徵矩陣 \(\lambda I-A\)\(\lambda I-B\) 等價。

由於特徵矩陣 \(\lambda I-A\) 只在主對角線含有 \(n\)\(\lambda\),所以秩為 \(n\)。由上述推理,同型的數陣的特徵矩陣的秩始終相等,於是有等價性:

數陣 \(A\)\(B\) 相似,等價於特徵矩陣 \(\lambda I-A\)\(\lambda I-B\) 有完全相同的初等因子。

對於特徵矩陣 \(\lambda I-A\),初等變換保持等價性,所以不改變秩。

觀察三種初等變換,由於唯一被改寫的倍加變換不改變行列式,事實上三種初等變換僅對行列式的結果多項式改變常數倍,因此不改變行列式的結果多項式的因式分解與次數。

因此特徵矩陣 \(\lambda I-A\) 的行列式為 \(n\) 次多項式,初等變換化為 Smith 標準型後,由於秩為 \(n\),行列式就是主對角線全體不變因子的乘積,也等於全體初等因子的乘積。因此,特徵矩陣 \(\lambda I-A\) 的全體初等因子的次數之和等於 \(n\)

Jordan 標準型

矩陣

\[ \begin{pmatrix} \lambda & 1 & 0 & \cdots & 0 & 0\\ 0 & \lambda & 1 & \cdots & 0 & 0\\ 0 & 0 & \lambda & \cdots & 0 & 0\\ \vdots & \vdots & \vdots & & \vdots & \vdots\\ 0 & 0 & 0 & \cdots & \lambda & 1\\ 0 & 0 & 0 & \cdots & 0 & \lambda\\ \end{pmatrix} \]

主對角線上的元素都是 \(\lambda\),緊鄰主對角線上方的元素都是 \(1\),其餘位置都是 \(0\),叫做屬於 \(\lambda\) 的一個 Jordan 矩陣,或稱 Jordan 塊。

顯然,冪零 Jordan 矩陣是 Jordan 矩陣的特例,即 \(\lambda\)\(0\) 的情形。

定理:設 \(T\)\(n\) 維空間 \(V\) 的一個變換,\(\lambda_1,\cdots,\lambda_k\)\(T\) 的一切互不相同的特徵值,那麼存在一個基,使得 \(T\) 關於這個基的矩陣有形狀:

\[ \begin{pmatrix} B_1 & & & 0\\ & B_2 & & \\ & & \ddots & \\ 0 & & & B_k\\ \end{pmatrix} \]

其中

\[ B_i=\begin{pmatrix} J_{i1} & & & 0\\ & J_{i2} & & \\ & & \ddots & \\ 0 & & & J_{is_i}\\ \end{pmatrix} \]

其中 \(J_{i1},\cdots,J_{is_i}\) 都是屬於 \(\lambda_i\) 的 Jordan 塊。

這是因為,首先根據最小多項式:

\[ m_A(\lambda)={(\lambda-\lambda_1)}^{r_1}{(\lambda-\lambda_2)}^{r_2}\cdots{(\lambda-\lambda_k)}^{r_k} \]

有準素分解:

\[ V=V_1\oplus V_2\oplus\cdots\oplus V_k \]

其中:

\[ V_i=N\left({(A-\lambda_i I)}^{r_i}\right) \]

式中 \(A\)\(T\) 對應的矩陣。

令變換 \(S_i\)\(T\)\(V_i\) 上的限制 \({T|}_{V_i}\),接下來試圖對每一個 \(S_i\) 進行 Jordan 分解。

\(T_e\)\(V\) 上的恆等變換。與前文的 Jordan 分解不同,記 \(T_i\)\(S_i\) 的 Jordan 分解中的冪零部分:

\[ S_i=\lambda_i T_e+T_i \]

於是 \(T_i\) 為子空間 \(V_i\) 的一個冪零變換,事實上也是 \(T-\lambda_i T_e\)\(V_i\) 上的限制 \({(T-\lambda_i T_e)|}_{V_i}\)

子空間 \(V_i\) 可以分解為冪零變換 \(T_i\) 循環子空間的直和:

\[ V_i=W_{i1}\oplus W_{i2}\oplus\cdots\oplus W_{is_i} \]

在每一個循環子空間 \(W_{ij}\) 裏,取一個循環基並倒序排列,湊成 \(V_i\) 的一個基,於是 \(T_i\) 關於這個基的矩陣有形狀:

\[ N_i=\begin{pmatrix} N_{i1} & & & 0\\ & N_{i2} & & \\ & & \ddots & \\ 0 & & & N_{is_i}\\ \end{pmatrix} \]

全體 \(N_{ij}\) 均為冪零 Jordan 塊。於是對於 \(V_i\) 上述選取的基,\(S_i\) 對應的矩陣是:

\[ B_i=\begin{pmatrix} \lambda_i & & & 0\\ & \lambda_i & & \\ & & \ddots & \\ 0 & & & \lambda_i\\ \end{pmatrix}+\begin{pmatrix} N_{i1} & & & 0\\ & N_{i2} & & \\ & & \ddots & \\ 0 & & & N_{is_i}\\ \end{pmatrix}=\begin{pmatrix} J_{i1} & & & 0\\ & J_{i2} & & \\ & & \ddots & \\ 0 & & & J_{is_i}\\ \end{pmatrix} \]

這裏 \(J_{i1},J_{i2},\cdots,J_{is_i}\) 都是屬於 \(\lambda_i\) 的 Jordan 塊。

對於每一個子空間 \(V_i\),按照以上方式選取一個基,湊起來成為 \(V\) 的基,那麼 \(T\) 關於這個基的矩陣即構成定理規定的形式。

形如:

\[ \begin{pmatrix} J_1 & & & 0\\ & J_2 & & \\ & & \ddots & \\ 0 & & & J_m\\ \end{pmatrix} \]

\(n\) 階矩陣,其中每一個 \(J_i\) 都是一個 Jordan 塊,叫做一個 Jordan 標準型。

定理:每一個 \(n\) 階矩陣 \(A\) 都與一個 Jordan 標準型相似。除了各個 Jordan 塊排列的次序以外,與 \(A\) 相似的 Jordan 標準型是由 \(A\) 唯一確定的。

注意在上述構造的矩陣 \(B_i\) 中,第一項是一個單位陣的若干倍,自然可以和第二項交換。因此,第一項就是 \(B_i\) 的 Jordan 分解的可對角化部分,第二項就是 \(B_i\) 的 Jordan 分解的冪零部分。

在一個矩陣對應的 Jordan 標準型裏面,主對角線上的元素構成的對角陣是這個矩陣對應的 Jordan 標準型的可對角化部分,把主對角線上的元素換成 \(0\) 就得到這個矩陣對應的 Jordan 標準型的冪零部分。

定理:對於矩陣 \(A\) 的 Jordan 標準型中,每一個 Jordan 塊:

\[ J_i=\begin{pmatrix} \lambda_i & 1 & & & \\ & \lambda_i & 1 & & \\ & & \ddots & \ddots & \\ & & & \ddots & 1\\ & & & & \lambda_i\\ \end{pmatrix} \]

對應於特徵矩陣 \(\lambda I-A\) 的一個初等因子 \({(\lambda-\lambda_i)}^{n_i}\),特徵矩陣 \(\lambda I-A\) 的全體初等因子對應於矩陣 \(A\) 的 Jordan 標準型中的全體 Jordan 塊。

這是因為,矩陣 \(A\) 相似於它的 Jordan 標準型,因此兩者的特徵矩陣也等價,將 Jordan 標準型的特徵矩陣化為 Smith 標準型即可看出。

由這個定理,藉助特徵矩陣 \(\lambda I-A\) 的初等因子,可以寫出矩陣 \(A\) 的 Jordan 標準型。

一個推論是,矩陣 \(A\) 可對角化,等價於特徵矩陣 \(\lambda I-A\) 的初等因子均為一次的。

弗羅貝尼烏斯(Forbenious)定理

上文指出,\(n\) 階特徵矩陣的 Smith 標準形的秩為 \(n\)

定理:設矩陣 \(A\) 的特徵矩陣 \(\lambda I-A\) 的 Smith 標準形為:

\[ \operatorname{diag}\{d_1(\lambda),d_2(\lambda),\cdots,d_n(\lambda)\} \]

則最後一個不變因子 \(d_n(\lambda)\) 恰好為矩陣 \(A\) 的最小多項式 \(m_A(\lambda)\)

推論:矩陣 \(A\) 可對角化的等價條件為:

  • 最小多項式 \(m_A(\lambda)\) 無重根。
  • 特徵矩陣 \(\lambda I-A\) 的不變因子無重根。
  • 特徵矩陣 \(\lambda I-A\) 的初等因子均為一次的。