跳转至

初等變換

初等矩陣

以下三類方陣稱為初等矩陣。

倍乘矩陣

倍乘矩陣是一種特殊的對角矩陣。

\[ D_i(k)=\operatorname{diag}\{1,\cdots,1,k,1,\cdots,1\} \]

表示一個對角陣,主對角線上第 \(i\) 個元素為 \(k\),並且規定 \(k\) 不能為 \(0\),其餘的元素全部為 \(1\)

特別地,當 \(k\)\(1\) 的時候,\(D_i(1)\) 就是單位陣 \(I\)

對換矩陣

對換矩陣是一種特殊的對稱矩陣。

\[ P_{ij}=\begin{pmatrix} I_{i-1} & & & & \\ & 0 & & 1 & \\ & & I_{j-i-1} & & \\ & 1 & & 0 & \\ & & & & I_{n-j}\\ \end{pmatrix} \]

對換矩陣的元素全是 \(1\)\(0\),主對角線上其餘元素均為 \(1\),僅有第 \(i\) 個元素和第 \(j\) 個元素為 \(0\),而在第 \(i\) 行第 \(j\) 列、第 \(j\) 行第 \(i\) 列上的兩個元素為 \(1\)

對換矩陣要求 \(i\)\(j\) 不能相等。

倍加矩陣

倍加矩陣是在單位陣 \(I\) 的基礎上,令第 \(i\) 行第 \(j\) 列為 \(k\)

\[ T_{ij}(k)=\begin{pmatrix} 1 & & & & & & \\ & \ddots & & & & & \\ & & 1 & \cdots & k & & \\ & & & \ddots & \vdots & & \\ & & & & 1 & & \\ & & & & & \ddots & \\ & & & & & & 1\\ \end{pmatrix} \]

倍加矩陣要求 \(i\)\(j\) 不能相等。如果 \(k\)\(0\),則 \(T_{ij}(0)\) 退化為單位陣 \(I\)

倍加矩陣是一種上三角矩陣或者下三角矩陣。

初等矩陣的行列式

三種初等矩陣具有行列式:

\[ |D_i(k)|=k \]
\[ |P_{ij}|=-1 \]
\[ |T_{ij}(k)|=1 \]

由於方陣乘法的行列式等於行列式的乘法,藉助下文初等變換與矩陣乘法的等價性,初等矩陣的這個性質可以用於行列式的計算。

初等變換

不僅限於方陣,對於一般的矩陣 \(A\),可以進行初等行變換和初等列變換,統稱為初等變換。

初等行變換與初等列變換一樣,都有 3 種:倍乘(multiplication)、對換(switching)、倍加(addition)。這裏先介紹初等行變換:

  • \(i\) 行乘非零數 \(k\)\(B\mapsto D_i(k)B\)
  • \(i\)\(j\) 行互換:\(B\mapsto P_{ij}B\)
  • \(j\) 行乘 \(k\) 加到第 \(i\) 行:\(B\mapsto T_{ij}(k)B\)

將上述操作的行改為列,即得到初等列變換。

在初等變換中,對換可以通過倍乘和倍加實現。顯然,倍加不能通過倍乘和對換實現。藉助行列式的知識,以及下文的初等變換與矩陣乘法的等價性,也能説明倍乘不能通過倍加和對換實現。

因此,相較對換而言,倍乘和倍加是更為本質的操作。對換操作是為了在消元法中,保證消元的有序,而引入的輔助操作。

初等變換與矩陣乘法

可以發現,三類初等矩陣都是在單位陣 \(I\) 上進行一次相應的變換得到的結果。在後文的線性變換中指出,線性變換與矩陣之間有對應關係,與這裏的關係類似。

無論矩陣 \(A\) 是否方陣,對矩陣 \(A\) 進行初等行變換,等價於對矩陣 \(A\) 左乘初等矩陣。對矩陣 \(A\) 進行初等列變換,等價於對矩陣 \(A\) 右乘初等矩陣。

倍乘操作

左乘一個倍乘矩陣 \(D_i(k)\),等價於將第 \(i\) 行變為 \(k\) 倍。右乘一個倍乘矩陣 \(D_i(k)\),等價於將第 \(i\) 列變為 \(k\) 倍。

對角陣乘對角陣還是對角陣,對於對角陣的乘法,將主對角線上對應的元素相乘。由於單位陣是特殊的倍乘陣,而倍乘陣要求 \(k\) 不為 \(0\),可以看出,只要對角陣主對角線上的元素均非 \(0\),就可以拆分為倍乘陣的乘積。

對於一般的對角陣,無論元素是否為 \(0\),也有相應的結論。左乘對角陣,等價於將對應的行變為原來的若干倍,倍數恰為對角陣主對角線上的相應元素。右乘對角陣,是對相應的列進行同樣操作。

由於倍乘矩陣 \(D_i(k)\) 的行列式為 \(k\),對於方陣的行或列進行倍乘操作之後,方陣對應的行列式變為原來的 \(k\) 倍。對角陣的行列式為主對角線元素的乘積。

倍乘矩陣的乘法可以交換,對角陣的乘法也可以交換,在乘法只有對角陣時,順序可以任意排列。

單位陣對應的倍乘操作為保持矩陣 \(A\) 不變,在實際應用中不進行這樣的操作。

對換操作

左乘一個對換矩陣 \(P_{ij}\),等價於將第 \(i\) 行與第 \(j\) 行交換。右乘一個對換矩陣 \(P_{ij}\),等價於將第 \(i\) 列與第 \(j\) 列交換。

與倍乘陣和對角陣的關係類似,這裏引入置換矩陣的概念。置換矩陣是一個方陣,每行每列均恰有一個 \(1\),其餘位置均為 \(0\)。單位陣 \(I\) 也是特殊的置換矩陣。

置換陣和對於單位陣 \(I\) 的行進行置換操作一致,也和對於單位陣 \(I\) 的列進行置換操作一致。單位陣 \(I\) 本身對應於恆等變換。

左乘一個置換矩陣等價於對原矩陣的行進行置換,右乘一個置換矩陣等價於對原矩陣的列進行置換,相應置換的方法和對於單位陣 \(I\) 的行或列進行置換操作一致。

置換矩陣與置換完全對應,置換矩陣構成的乘法羣與置換羣同構。由於有定理,在恆等變換視為零個對換的乘積的情形下,任何置換都可以拆為對換的乘積,因此任何置換矩陣也可以拆分為對換矩陣的乘積。

由於對換矩陣的行列式為 \(-1\),對於方陣的行或列進行對換操作之後,方陣對應的行列式變為原來的 \(-1\) 倍。

對換陣的乘法不可交換,置換陣的乘法也不可交換。

置換矩陣的行列式為 \({(-1)}^p\),其中 \(p\) 為置換矩陣對應置換的逆序數,即置換拆分為對換乘積的個數。

倍加操作

左乘倍加矩陣 \(T_{ij}(k)\) 等價於把第 \(j\) 行的 \(k\) 倍加到第 \(i\) 行上。右乘倍加矩陣 \(T_{ij}(k)\) 等價於把第 \(i\) 列的 \(k\) 倍加到第 \(j\) 列上。

如果難以記憶,可以觀察倍加陣 \(T_{ij}(k)\) 是對單位陣 \(I\) 進行了怎樣的操作,兩者是對應的,左乘是對行的操作,右乘是對列的操作,符合口訣左行右列。

由於倍加矩陣的行列式為 \(1\),對於方陣進行倍加操作之後,方陣對應的行列式不變。

倍加矩陣的乘法不可交換。

單位陣對應的倍加操作為保持矩陣 \(A\) 不變,在實際應用中不進行這樣的操作。

上三角矩陣

倍加矩陣是一種上三角矩陣或者下三角矩陣。由於兩種矩陣關於主對角線對稱,這裏討論上三角矩陣。事實上在這個例子中,只需要進行初等行變換,而不需要列變換。

如果一個上三角矩陣的主對角線均為 \(1\),則可拆分為一連串倍加矩陣的乘積。拆分的順序為,先對單位矩陣 \(I\) 的第一行進行倍加操作,再對單位矩陣 \(I\) 的第二行進行倍加操作,以此類推,直到每一行均被操作完畢為止。

由於倍加矩陣的乘法不可交換,上述操作不可調換順序。

如果一個上三角矩陣的主對角線均非 \(0\),則可拆分為一連串倍加矩陣和倍乘矩陣的乘積。可以在操作單位矩陣 \(I\) 的每一行時,先將該行進行倍乘操作,效果為主對角線元素變為指定非零值。

如果一個上三角矩陣的主對角線存在 \(0\),則不可拆分為一連串初等矩陣的乘積。

無論上三角矩陣的主對角線上是否有 \(0\),上三角矩陣的行列式等於主對角線元素乘積,與對角陣一致。

倍加操作將方陣轉化為對角陣

只使用倍加操作可以使任意一個方陣變為對角陣,這個例子既需要初等行變換也需要初等列變換。

如果方陣的第一行和第一列存在非零元素,則可以通過倍加辦法將左上角元素變為非零,進而藉助初等行變換和初等列變換,將第一行和第一列除了左上角元素以外,均變為 \(0\)

如果方陣的第一行和第一列已經均為 \(0\),則直接看第二行和第二列即可。

藉助這個辦法,甚至可以規定對角陣的非零元素均在左上角。

如果方陣的第一行和第一列已經均為 \(0\),則看剩餘的行列是否有非零元素,只要有非零元素,則可以通過倍加操作將第一行和第一列中某個元素變為非 \(0\),進而化歸為一開始的情況,使得左上角元素非 \(0\)

僅當剩餘的行列也均沒有非零元素時,左上角無法變為非零元素,此時剩餘的方陣已經為零矩陣。

標準形矩陣

藉助初等變換可以將任意的矩陣,無論形狀,化歸為標準形矩陣。

標準形矩陣擁有一個單位陣 \(I\) 作為子矩陣位於左上角,其餘部分均為 \(0\)。化歸的辦法與將方陣轉化為對角陣的操作類似,並需要藉助倍乘操作使左上角非零元素變為 \(1\)

矩陣轉化為標準形矩陣後,含有元素 \(1\) 的個數恰好為矩陣的秩。

可逆矩陣

\(A\) 是一個 \(n\) 階矩陣。如果存在一個 \(n\) 階矩陣 \(B\),使得 \(AB=BA=I\),那麼 \(A\) 叫做一個可逆矩陣或非奇異矩陣,\(B\) 叫做 \(A\) 的逆矩陣,並記為 \(A^{-1}\)

如果矩陣 \(A\) 可逆,那麼 \(A\) 的逆矩陣由 \(A\) 唯一確定。

可逆矩陣 \(A\) 的逆 \(A^{-1}\) 也可逆,並且 \(A^{-1}\) 的逆就是 \(A\)

兩個可逆矩陣 \(A\)\(B\) 的乘積 \(AB\) 也可逆,並且逆為 \(B^{-1}A^{-1}\)

可逆矩陣 \(A\) 的轉置 \(A^T\) 也可逆,並且轉置的逆等於逆的轉置。

初等矩陣的逆

初等矩陣均可逆,並且逆為同類的初等矩陣:

\[ {D_i(k)}^{-1}=D_i\left(\frac{1}{k}\right) \]
\[ P_{ij}^{-1}=P_{ij} \]
\[ T_{ij}(k)^{-1}=T_{ij}(-k) \]

顯然單位陣 \(I\) 可逆,逆矩陣仍為 \(I\)

初等變換保持矩陣的可逆性,變換前後矩陣要麼同時可逆,要麼同時不可逆。

矩陣 \(A\) 可逆,當且僅當矩陣 \(A\) 可以寫成初等矩陣的乘積,即可以通過初等變換變為單位陣 \(I\)

等到引入行列式之後可以知道:

矩陣 \(A\) 可逆,當且僅當矩陣 \(A\) 的秩為 \(n\),當且僅當矩陣 \(A\) 的行列式非 \(0\)

一種簡單的記法為:記 \(E_{ij}\) 為第 \(i\) 行第 \(j\) 列的元素為 \(1\)、其餘為零的 \(n\times n\) 矩陣,那麼

  • \(D_i(k)=I_n+(k-1)E_{ii}\)
  • \(P_{ij}=I_n-E_{ii}-E_{jj}+E_{ij}+E_{ji}\)
  • \(T_{ij}(k)=I_n+kE_{ij}\)

這種記法也可以應用於它們的逆矩陣。

應用

線性方程組求解

對於一個線性方程組,未知數前的係數構成係數矩陣,如果在係數矩陣右端補上線性方程組的常數項則構成增廣矩陣。

應用初等行變換,可以將線性方程組對應的增廣矩陣先轉化為行階梯形矩陣,再轉化為行最簡形矩陣,進而完成線性方程組的求解。這個方法叫做消元法解線性方程組,後文的 Gauss–Jordan 消元,是按照一定的順序進行的消元算法。

行列式計算

由於方陣乘積的行列式等於方陣行列式的乘積,初等矩陣的行列式便於計算,以及初等變換等價於初等矩陣的乘法,在行列式計算中也會使用初等變換。

由於按照一定的順序進行初等變換更加便於程序書寫,行列式計算也可以使用後文的 Gauss–Jordan 消元算法。