5.1. 向量空間是主理想整環上有限生成模
1. 在上一講研究模理論的目的是為了站在更高的層面上來認識線性代數。在這一講回到向量空間和線性變換, 應用上一講中的結果翻譯成向量空間的語言。這裡 $ V $ 不僅僅是域 $ F $ 上的向量空間, 更是多項式 $ F[x] $ 上的模, 其數乘定義為 $$ p(x)v= p(T)(v), $$ 這裡 $ p(x)\in F[x] $, $ v\in V $, $ T\in {\mathcal L}(V) $。 本講中向量空間均指有限維的, 以下不再每次注明。
若 $ V $ 是域 $ F $ 上的向量空間, 線性算子 $ T\in {\mathcal L}(V) $, 對於 $ V $ 中的一個基底, $ T $ 對應於 $ F $ 上的一個矩陣, 對於 $ V $ 中另一個基, $ T $ 對應另一個矩陣, 在3.1節中已經知道, 這兩個矩陣是相似的。
問題是: 對於一個固定的 $ T\in {\mathcal L}(V) $, 如何來選取 $ V $ 的基底, 使得對應於 $ T $ 的矩陣盡可能簡單。 當然最簡單的矩陣是對角線矩陣, 但不是所有的 $ T\in {\mathcal L}(V) $, 都能做到這點。 為此, 只能求其次, 希望能找到另一種簡單的矩陣。
上述問題也可敘述為: 若 $ V $ 是域 $ F $ 上的向量空間, 要找出所有與 $ {\mathcal L}(V) $ 中給定的線性算子相對應的矩陣在相似意義下的標準形式。 這是線性代數中討論的最基本問題之一。
首先, 若 $ V $ 是域 $ F $ 上的 $ n $ 維向量空間, 則 $ V $ 作為 $ F[x] $ -模是撓模。 顯然, $ {\mathcal L}(V) $ 同構於由所有 $ n\times n $ 矩陣組成的向量空間 $ {\mathcal M}_n(F) $。 $ {\mathcal M}_n(F) $ 的維數為 $ n^2 $, 故對於 $ {\mathcal L}(V) $ 中任一固定的 $ T $, $ n^2+1 $ 個向量 $$ {\mbox {Id}},\,T,\, T^2,\,\ldots,\, T^{n^2}, $$ 是線性相依的, 故在 $ F[x] $ 中有 $ p(x) $ 使得 $ p(T)=0 $。 故 $ p(x)v=\{0\} $。 因此 $ V $ 中所有元素是撓元。
其次, $ V $ 作為 $ F[x]- $ 模是有限生成模。 若 $ {\mathcal B}= \{v_1,\ldots,v_n\} $ 是向量空間 $ V $ 的一組基底, 則每個向量 $ v\in V $, 存在純量 $ r_1,\ldots,r_n\in F\,\subset \, F[x] $ 使得有下面的線性組合關係成立 : $$ v= r_1v_1+ r_2v_2+\ldots+ r_nv_n, $$ 故 $ {\mathcal B} $ 生成模 $ V $。
在1.2節中已知 $ F[x] $ 是一主理想整域 (Principal ideal integral domain), 其中 $ F $ 是一個域。 因此, 向量空間 $ V $ 也是主理想整環 $ F[x] $ 上有限生成撓模。 所以上一講中討論的分解定理能夠在此應用。
2. 前面已定義過向量空間 $ V $ 的一個子空間 $ S $, 對一個固定的 $ T\in {\mathcal L}(V) $ 來講不變的意思, 也就是如果 $ T(S)\,\subset\, S $, $ S $ 稱為關於 $ T $ 的不變子空間。 不難證明, $ V $ 作為 $ F[x] $ 上的模, 其部分集合 $ S $ 是一個子模若且唯若 $ S $ 是向量空間 $ V $ 關於 $ T $ 的不變子空間。
固定 $ T\in {\mathcal L}(V) $, 模 $ V $ 的零化子為 $$ {\mbox{ann}}(V)=\big\{p(x)\in F[x]:\,\,\, p(x)T=\{0\}\big\}. $$ 這是 $ F[x] $ 上的一個非零主理想(因為 $ F[x] $ 是主理想環)。 由於 $ V $ 的階, 即 $ {\mbox{ann}}(V) $ 的生成元, 是相伴的, 而 $ F[x] $ 的可逆元就是 $ F $ 中的非零元素, 故 $ V $ 有唯一的 首一階(monic order)。 稱這個唯一的首一階, 即生成 $ {\mbox{ann}}(V) $ 的唯一首一多項式, 為 $ T $ 的 極小多項式 (minimal polynomial), 記作 $ m_T(x) $ 或 $ m(T) $。 於是 $$ {\mbox{ann}}(V)= \langle m_T(x)\rangle $$ 及 $$ p(x)\,V= \{0\}\,\,\,\Leftrightarrow\,\,\, m_T(x)\big|\,p(x), $$ 或 $$ p(T)=0\,\,\,\Leftrightarrow\,\,\, m_T(x)\big|\,p(x). $$ 在傳統的線性代數的書中, 並未引入模的概念, 對於線性算子 $ T $ 的極小多項式定義為使 $ p(T)=0 $ 的最低次的唯一的首一多項式。 對矩陣也可定義極小多項式。若 $ A $ 是域 $ F $ 上的一個方陣, $ A $ 的極小多項式 $ m_A(x) $ 是使 $ p(A)=0 $ 的最低次的唯一的首一多項式 $ p(x)\,\in \,F[x] $。
我們立即可以得到下面幾個明顯的推論。
- 若 $ A $ 與 $ B $ 是相似矩陣, 則 $ m_A(x)=m_B(x) $, 即極小多項式在相似的意義下不變;
- $ T\in {\mathcal L}(V) $ 的極小多項式與 $ T $ 相對應的矩陣 $ A_T $ 的極小多項式 $ m_{A_T}(x) $ 是相同的;
- 若 $ S $ 是模 $ V $ 的子模, 則 $ S $ 的首一階是限制 $ T\big|_S $ 的極小多項式。
3. 固定 $ T\in {\mathcal L}(V) $, 考慮循環子模 $$ \langle v\rangle= \big\{ p(x)v:\,\,\,p(x)\in F[x]\big\}. $$ 設其首一階是 $ m(x) $。 於是 $ m(x) $ 是限制 $ \sigma= T\big|_{\langle v\rangle} $ 的極小多項式 (見(2))。 若 $$ m(x)= a_0+a_1x+a_2x^2+\ldots+ a_{n-1}x^{n-1}+a_nx^n, $$ 則可證 $$ {\mathcal B}=\big(v,\,xv,\,\ldots,\,x^{n-1}v\big)=\big(v,\,\sigma(v),\,\ldots,\,\sigma^{n-1}(v)\big) $$ 是向量空間 $ \langle v\rangle $ 的一組基底。
我們先證 $ {\mathcal B} $ 是線性獨立的。若存在非零純量 $ \alpha_j $ , $ j=0,1,\ldots,n-1 $ 使得 $$ \alpha_0 v+\alpha_1\sigma(v)+\ldots+ \alpha_{n-1}\sigma^{n-1}(v)=0, $$ 即 $$ \big(\alpha_0 +\alpha_1x+\ldots+ \alpha_{n-1}x^{n-1}\big)v=0, $$ 則 $$ \big(\alpha_0 +\alpha_1x+\ldots+ \alpha_{n-1}x^{n-1}\big)\langle v\rangle =\{0\}, $$ 故 $ m(x)\big(\alpha_0 +\alpha_1x+\ldots+ \alpha_{n-1}x^{n-1}\big)=0 $, 這導致 $ \alpha_j=0 $ , $ j=0,1,\ldots,n-1 $。 現在再證 $ {\mathcal B} $ 生成 $ \langle v\rangle $。 我們知道 $ \langle v\rangle $ 中每個元素是 $ p(x) v $, $ p(x) \in F[x] $ 的形式, 將 $ p(x) $ 除以極小多項式 $ m(x) $, 得 $$ p(x)=q(x)m(x)+r(x), $$ 這裡 $ {\mbox{deg}}\,r(x)\,\lt \,{\mbox{deg}}\,m(x)=n $。 由於 $ m(x)v=0 $, 故 $ p(x)v=r(x)v $, 這表明 $ \langle v\rangle $ 中每個元素是 $ r(x) v $ 的形式。也就是 $$ \langle v\rangle=\big\{ r(x)v:\,\,\, {\mbox{deg}}\,r(x)\,\lt \,{\mbox{deg}}\,m(x)\big\}={\mbox{span}}({\mathcal B}). $$ 因此, $ {\mathcal B} $ 是 $ \langle v\rangle $ 的一組基底。
現在我們來計算 $ \sigma $ 在基底 $ {\mathcal B} $ 之下的矩陣表示 $ [\sigma]_{\mathcal B} $。 當 $ j=0,1,\ldots,n-2 $, 則 $$ \sigma\big(\sigma^j(v)\big)= \sigma^{j+1}(v). $$ 而由於 $ m(x) $ 是 $ \sigma $ 的極小多項式, 所以 \begin{equation*} \begin{split} \sigma\big(\sigma^{n-1}(v)\big)\,=&\, \sigma^n(v)= -\big(a_0+a_1\sigma+\cdots +a_{n-1}\sigma^{n-1}\big)(v)\\ =&\, -a_0v-a_1\sigma(v)-\cdots-a_{n-1}\sigma^{n-1}(v). \end{split} \end{equation*} 於是在基底 $ {\mathcal B} $ 之下的矩陣表示為 $ C[m(x)] $, $$ \sigma\,{\mathcal B}={\mathcal B} C[m(x)], $$ 而 \begin{equation*} C[m(x)]=\left[ \begin{array}{cccccc} ~0~&~0~&~\cdots~ &~0~&~-a_0~\\ 1&0&\cdots &0&-a_1\\ 0&1&\cdots &~\cdots~ &~\cdots~ \\ \vdots &\vdots &~\ddots~ & 0&-a_{n-2}\\ 0&0&\cdots &1&~-a_{n-1}~\end{array} \right], \end{equation*} $ C[m(x)] $ 稱為多項式 $$ m(x)= a_0+a_1x+\cdots+a_{n-1}x^{n-1}+x^n $$ 的友矩陣(companion matrix)。這只對首一多項式定義。
若 $ \tau\in {\mathcal L}(V) $, $ V $ 的一個子空間 $ S $ 稱為 $ \tau $ -循環 ($ \tau $ -cyclic), 若存在 $ v\in S $ 使得 $$ \big\{v\,,\tau(v),\, \cdots,\, \tau^{m-1}(v)\big\} $$ 是 $ S $ 的一組基底, 這裡 $ m={\mbox{dim}}(S) $。 於是我們得到
- $ S $ 是 $ V $ 的部分集合, $ S $ 是 $ V $ 的循環子模若且唯若它是 $ V $ 的循環部分空間。
- 若 $ \langle v\rangle $ 是 $ V $ 的一個循環子模, $ \langle v\rangle $ 的首一階 (即 $ \sigma=\tau\big|_{\langle v\rangle}$ 的極小多項式)是 $$ m_\sigma(x)= a_0+a_1x+\cdots+a_{n-1}x^{n-1}+x^n, $$ 則 $$ {\mathcal B}=\big\langle v,\,xv,\,\ldots,\,x^{n-1}v\big\rangle= \big\langle v,\,\sigma(v),\,\ldots,\,\sigma^{n-1}(v)\big\rangle $$ 是 $ \langle v\rangle $ 的一組基底, $ \sigma $ 對 $ {\mathcal B} $ 而言的矩陣 $ [\sigma]_ {\mathcal B} $ 是 $ m_\sigma(x) $ 的友矩陣 $ C\big(m_\sigma(x)\big) $。
5.2. 向量空間的分解
有了上一節作準備, 就可以將上一講中的分解定理翻譯成向量空間中的結果。 定理 4.3.5 便可以寫成下面的形式 :
定理5.2.1: (向量空間關於線性變換的循環分解定理) 若 $ V $ 為有限維向量空間, $ \tau\in {\mathcal L}(V) $。 若 $ \tau $ 的極小多項式為 $$ m_\tau(x)= p_1^{e_1}(x)\,\ldots\, p_n^{e_n}(x), $$ 這裡 $ p_j(x) $, $ j=1,\ldots,n $ 是相互不同的, 不可約的首一多項式, 則 $ V $ 可分解為直和 $$ V= V_{p_1}\,\oplus\, \cdots\,\oplus\, V_{p_n}, $$ 這裡 $$ V_{p_j}= \big\{v\in V:\,\, p_j^{e_j}(v)=0\big\} $$ 是 $ V $ 的不變子空間(子模), 而 $ \tau\big|_{V_{p_j}} $ 的極小多項式為 $$ \min(\tau\big|_{V_{p_j}})= p_j^{e_j}(x),\qquad j=1,\ldots,n. $$ 再進一步講, $ V_{p_j} $, $ j=1,\ldots,n $ 可以再分解為 $ \tau $-循環子空間(循環子模)的直和 $$ V_{p_j}= \langle v_{j,1}\rangle \,\oplus\,\ldots\,\oplus \langle v_{j,k_j}\rangle, $$ 這裡 $ \tau\big|_{V_{p_j}} $ 的極小多項式為 $$ \min(\tau\big|_{\langle v_{j,\ell}\rangle})= p_j^{e_{j,\ell}}(x),\qquad j=1,\ldots,n,\,\,\, \ell=1,\ldots, k_j, $$ 而 $$ e_j= e_{j,1}\,\ge\, e_{j,2}\,\ge\, \cdots\, \ge\, e_{j,k_j}\,\ge \, 1,\qquad j=1,\ldots, n, $$ $ V $ 的初等因子 $ p_j^{e_{j,\ell}}(x) $, 也就是 $ \tau $ 的初等因子, 由算子 $ \tau $ 唯一決定。歸納起來, $ V $ 可以分解為 $ \tau $ -循環子空間的直和 \begin{equation} \label{eq:direct} V= \big(\langle v_{1,1}\rangle \,\oplus\,\ldots\,\oplus \langle v_{1,k_1}\rangle\big)\, \oplus\, \cdots\,\oplus\,\big((\langle v_{n,1}\rangle \,\oplus\,\ldots\,\oplus \langle v_{n,k_n}\rangle\big). \end{equation}
在定理4.3.5中, 要求階 $ \mu=p_1^{e_1}\cdots p_n^{e_n} $, 這裡 $ p_j $, $ j=1,\ldots,n $, 為互不相伴的素元素。 在定理5.2.1中, 說 $ p_j(x) $, $ j=1,\ldots,n $, 為互不相同的不可約多項式。由於 $ F[x] $ 是主理想整環, 故素元素與不可約元素是一致的。
我們現在可以用循環分解定理來決定相似意義下的標準形式。 若 $ V=S\,\oplus\, T $, $ S,\, T $ 都是 $ \tau\in {\mathcal L}(V) $ 之下的不變子空間, 則稱 $ (S,\, T) $ 約化 (reduce) $ \tau $。 若 $ V=S\,\oplus\, T $ 且 $$ \tau\big|_{S}\,:\,S\,\rightarrow\, S,\qquad \tau\big|_{T}\,:\,T\,\rightarrow\, T $$ 分別是 $ S,\, T $ 上的線性算子。記 $ \tau= \rho\,\oplus\,\sigma $, 若存在 $ V $ 的子空間 $ S $ 與 $ T $, 使得 $ (S,\, T) $ 約化 $ \tau $, 及 $$ \rho=\tau\big|_{S},\qquad \sigma=\tau\big|_{T}. $$ 假設 $ {\mathcal C}= (c_1,\ldots,c_s) $ 是 $ S $ 的一組基底, $ {\mathcal D}= (d_1,\ldots,d_t) $ 是 $ T $ 的一組基底, 則 $$ {\mathcal B}= (c_1,\ldots,c_s,d_1,\ldots, d_t),\qquad s+t=n $$ 是 $ V $ 的一組基底。於是矩陣 $ [\tau]_{\mathcal B} $ 可以寫成分塊對角矩陣 (block diagonal matrix): \begin{equation*} [\tau]_{\mathcal B}=\left[\begin{array}{cc} ~[\rho]_{\mathcal C}~&0 \\ 0& ~[\sigma]_{\mathcal D}~\end{array} \right]. \end{equation*} 這可推廣到 $ \tau $ 可分解為多個線性算子的直和的情形。
回到\eqref{eq:direct}。 若 $ {\mathcal B}_{j,\ell} $ 是循環子模 $ \langle v_{j,\ell}\rangle $ 的一組基底, 而 $$ {\mathcal B}=\big({\mathcal B}_{1,1},{\mathcal B}_{1,2},\ldots, {\mathcal B}_{n,k_n}\big) $$ 為 $ V $ 的一組基底, 則由定理5.2.1, \begin{equation*} [\tau]_{\mathcal B}=\left[\begin{array}{rrrrrr} [\tau_{1,1}]_{{\mathcal B}_{1,1}}&&\\ &\ddots &\\ && [\tau_{n,k_n}]_{{\mathcal B}_{n,k_n}} \end{array} \right]. \end{equation*} 這裡 $ \tau_{j,\ell}=\tau\big|_{\langle v_{j,\ell}\rangle} $, $ j=1,\ldots, n $ 及 $ \ell=1,\ldots, k_n $。
我們知道循環子模 $ \langle v_{j,\ell}\rangle $ 有一首階 $ p_j^{e_{j,\ell}}(x) $, 即限制 $ \tau_{j,\ell} $ 有極小多項式 $ p_j^{e_{j,\ell}}(x) $。 於是若 $$ {\mbox{deg}}\Big(p_j^{e_{j,\ell}}(x)\Big)=d_{j,\ell}, $$ 則 $$ {\mathcal B}_{j,\ell}=\big (v_{j,\ell},\tau_{j,\ell}(v_{j,\ell}),\ldots, \tau_{j,\ell}^{d_{j,\ell}-1}(v_{j,\ell})\big) $$ 是 $ \langle v_{j,\ell}\rangle $ 的一組基底, $ j=1,\ldots, n $, $ \ell=1,\ldots, k_n $。 因此便得到下面的定理。
定理5.2.2: 若 $ V $ 是有限維的向量空間, $ \tau\in {\mathcal L}(V) $ 的極小多項式為 $$ m_\tau(x)= p_1^{e_1}(x)\,\ldots\, p_n^{e_n}(x), $$ 這裡首一多項式 $ p_j^{e_j}(x) $, $ j=1,\ldots, n $, 是相互不同的, 不可約的, 則 $ V $ 有如下分解 \begin{equation*} V= \big(\langle v_{1,1}\rangle \,\oplus\,\ldots\,\oplus \langle v_{1,k_1}\rangle\big)\, \oplus\, \cdots\,\oplus\,\big((\langle v_{n,1}\rangle \,\oplus\,\ldots\,\oplus \langle v_{n,k_n}\rangle\big), \end{equation*} 這裡 $ \langle v_{j,\ell}\rangle $, $ j=1,\ldots, n $, $ \ell=1,\ldots, k_n $ 是 $ V $ 的 $ \tau_{j,\ell} $ -循環子空間; 這裡 $ \tau_{j,\ell}=\tau\big|_{\langle v_{j,\ell}\rangle} $, 它的極小多項式是 $ V $ 的初等因子 $$ \min\big(\tau_{j,\ell}\big)= p_j^{e_{j,\ell}}(x), $$ 這裡 $$ e_j= e_{j,1}\,\ge\, e_{j,2}\,\ge\, \cdots\, \ge\, e_{j,k_j}\,\ge \, 1,\qquad j=1,\ldots, n. $$ 初等因子由 $ \tau $ 唯一決定。若 $$ {\mbox{deg}}\Big(p_j^{e_{j,\ell}}(x)\Big)=d_{j,\ell}, $$ 則 $$ {\mathcal B}_{j,\ell}=\big (v_{j,\ell},\tau_{j,\ell}(v_{j,\ell}),\ldots, \tau_{j,\ell}^{d_{j,\ell}-1}(v_{j,\ell})\big) $$ 是 $ \langle v_{j,\ell}\rangle $ 的一組基底, $ \tau $ 相對於基底 $$ {\mathcal B}=\big({\mathcal B}_{1,1},{\mathcal B}_{1,2},\ldots, {\mathcal B}_{n,k_n}\big) $$ 的矩陣表示是分塊對角矩陣 \begin{equation*} [\tau]_{\mathcal B}=\left[\begin{array}{ccccccc} C [p_1^{e_{1,1}}(x)]&&&&&&\\ &\ddots &&&&&\\ && C [p_1^{e_{1,k_1}}(x)] &&&&\\ &&&\ddots &&&\\ &&&& C [p_n^{e_{n,1}}(x)] &&\\ &&&&&\ddots &\\ &&&&& &C [p_n^{e_{n,k_n}}(x)] \end{array} \right]. \end{equation*} 上式右邊的矩陣稱為 $ \tau $ 的 有理標準形式 (rational canonical form)。這還可以寫成 \begin{equation*} [\tau]_{\mathcal B}={\mbox{diag}}\big(C [p_1^{e_{1,1}}(x)],\ldots, C [p_n^{e_{n,k_n}}(x)]\big). \end{equation*} 由向量空間的循環分解的唯一性定理, 這樣的有理標準形式是唯一的。
定理5.2.2 用矩陣的語言為: 任意矩陣 $ A $ 唯一地(除去對角線上分塊的次序) 相似於一個有理標準形式的矩陣。 由此還可得到 : 代數域 $ F $ 上兩個矩陣是相似的若且唯若它們有相同的初等因子。
定理5.2.1及定理5.2.2是線性代數的頂峰之一。從幾何上講, 它們徹底解決了代數域上的向量空間, 在一個線性變換下的分解。 從代數上講, 它們徹底地解決了一個代數域上的矩陣在相似變換下的分類。
5.3. 特徵多項式、特徵值與特徵向量
1. 若 $ p(x)= a_0+a_1x+\cdots+a_{n-1}x^{n-1}+x^n $, $ C[p(x)] $ 為其友矩陣, 令 \begin{equation*} A= xI- C[p(x)]= \left[\begin{array}{cccccc} x&0&\cdots &0&a_0\\ ~-1~&x&\cdots &0&a_1\\ 0&~-1~&\ddots &\vdots &\vdots\\ \vdots &\vdots &\ddots &x &a_{n-2}\\ 0&0 &~\cdots~ &~-1~ &~x+a_{n-1}~ \end{array} \right]. \end{equation*} 顯然 $ A $ 是 $ x,\, a_0,\, \ldots,\, a_{n-1} $ 的函數, 記作 $ A= A(x; a_0,\, \ldots,\, a_{n-1}) $。
命題5.3.1: 我們有 $ {\mbox {det}}\,\big(xI- C[p(x)]\big)= p(x) $。
證明 : 當 $ n=2 $ 時, 則 \begin{equation*} \begin{split} {\mbox {det}}\,\big(A(x;a_0,\, a_1)\big)=& \left| \begin{array}{cc} x & a_0\\ ~-1~ &~x+a_1~\end{array} \right |= x(x+a_1)+ a_0\\ =&a_0+ a_1x+ x^2= p(x). \end{split} \end{equation*} 當 $ n=3 $ 時, 則 \begin{equation*} \begin{split} {\mbox {det}}\,\big(A(x;a_0,\, a_1,\, a_2)\big) =& \left| \begin{array}{ccc} x & 0 &a_0\\ ~-1~ &x &a_1\\ 0& ~-1~ &~x+a_2~\end{array} \right |\\ =& x\left |\begin{array}{cc} x &a_1\\ ~-1~ &~x+a_2~\end{array} \right|+ a_0 \left |\begin{array}{cc} ~-1~& x\\ 0 & ~-1~\end{array} \right|\\ =& a_0+ a_1x+ a_2x^2+ x^3= p(x). \end{split} \end{equation*} 對一般的 $ n $, 對行列式沿第一行展開, 得到 $$ {\mbox {det}}\,\big(A(x;a_0,\, \cdots,\, a_{n-1}\big) = x\, {\mbox{det}}\big(A(x; a_1,\,\ldots,\, a_{n-1})\big)+ (-1)^{n+1}(-1)^{n-1}a_0. $$ 由數學歸納法假設, 這等於 $$ x\,\big(x^{n-1}+ a_{n-1}x^{n-2}+ \cdots+ a_1\big)+a_0= p(x). $$ 由命題5.3.1可得如下結論 :
命題5.3.2: 若 $ \tau\in {\mathcal L}(V) $, $ R $ 是 $ \tau $ 的有理標準形式, 則 $$ C_\tau(x)= {\mbox {det}}\big(xI-R\big)= \prod_{j,\ell}\, p_j^{e_{j,\ell}}(x), $$ 這個行列式稱為 $ \tau $ 的 特徵多項式 (eigenpolynomial 或 characteristic polynomial)。 在線性代數通常的書中, 往往先定義矩陣的特徵多項式, 然後再定義線性算子的特徵多項式。方陣 $ A $ 的特徵多項式定義為 $ {\mbox {det}}\big(xI-A\big) $。 由此可得下面的結論。
- 若 $ A $ 與 $ B $ 相似, 則 $ C_A(x)= C_B(x) $。 即特徵多項式在相似下不變。
- 線性代數 $ \tau $ 的特徵多項式和與 $ \tau $ 相對應矩陣的特徵多項式相等。
- 線性代數 $ \tau $ 的特徵多項式是 $ \tau $ 的初等因子的乘積。
2. $ \lambda\in F $ 是線性算子 $ \tau\in {\mathcal L}(V) $ 的特徵多項式 $ C_\tau(x) $ 的根, 若且唯若 $$ {\mbox {det}}\big(\lambda I-R\big)= 0, $$ 即矩陣 $ \lambda I-R $ 是奇異的。若 $ {\mbox{dim}}(V)= d $, 則 $ \tau $ 的有理標準形式 $ R $ 為 $ d\times d $ 的矩陣。 故 $ {\mbox {det}}\big(\lambda I-R\big)= 0 $ 若且唯若存在非零向量 $ x\in F^d $, 使得 $$ \big(\lambda I-R\big)\, (x)= 0, $$ 即 $$ R(x)= \lambda x. $$ 若 $ v\in V $ 是非零向量使得 $ [v]_{\mathcal B}= x $, 這裡 $ {\mathcal B} $ 是 $ V $ 的基底使 $ \tau $ 的矩陣為 $ R $, 則上式等價於 $$ \tau(v)= \lambda v. $$
定義5.3.1: 若 $ \tau\in {\mathcal L}(V) $, 數量 $ \lambda\in F $ 是 $ \tau $ 的一個特徵值(eigenvalue), 若存在非零向量 $ v\in V $, 使得 $$ \tau(v)= \lambda v. $$ 這時稱 $ v $ 為 $ \tau $ 的一個特徵向量(eigenvector)。
若 $ A $ 為 $ F $ 上的矩陣, $ \lambda\in F $ 是 $ A $ 的特徵值若存在非零特徵向量 $ x $, 使得 $$ A(x)= \lambda x. $$ 這時稱 $ x $ 為 $ A $ 的以 $ \lambda $ 為特徵值的特徵向量。對一個給定的特徵值 $ \lambda $, 所有以 $ \lambda $ 為特徵值的特徵向量加上零向量, 組成 $ V $ 的一個子空間, 稱為 $ \lambda $ 的特徵空間(eigenspace), 記作 $ {\mathcal E}_\lambda $。 由此得如下結論
命題5.3.3:
- $ \lambda\in F $ 是 $ \tau\in {\mathcal L}(V) $ 的一個特徵值若且唯若它是 $ \tau $ 的特徵多項式 $ C_\tau(x) $ 的根。
- $ \lambda\in F $ 是 $ \tau\in {\mathcal L}(V) $ 的一個特徵值若且唯若它是 $ \tau $ 的極小多項式 $ m_\tau(x) $ 的根。
- $ \lambda\in F $ 是 $ \tau\in {\mathcal L}(V) $ 的一個特徵值若且唯若它是與 $ \tau $ 相對應任何矩陣的特徵值。
- 矩陣的特徵值在相似意義下不變。
- 若 $ \lambda\in F $ 是矩陣 $ A $ 的一個特徵值, 則特徵空間 $ {\mathcal E}_\lambda $ 是幾次方程組 $$ \big(\lambda I-A\big)\, (x)= 0, $$ 的解組成的空間。
證明: 這裡只證明(c)。 $ \lambda\in F $ 是 $ \tau\in {\mathcal L}(V) $ 的一個特徵值若且唯若存在 $ 0\,\ne\, v\in V $, 使得 $$ \tau(v)=\lambda v. $$ 假設 $ {\mbox{dim}}(V)= d $, $ {\mathcal B} $ 為 $ V $ 的一組基底, 令 $$ \phi_{\mathcal B}\,:\,V\,\rightarrow\, F^d $$ 為由 $ \phi_{\mathcal B}(u)= [u]_{\mathcal B} $ 定義的同構。若 $ A= [\tau]_{\mathcal B} $, 則 $$ \tau= \big(\phi_{\mathcal B}\big)^{-1}A\, \phi_{\mathcal B}. $$ 於是 $ \tau(v)= \lambda v $ 就是 $$ \big(\phi_{\mathcal B}\big)^{-1}A\, \phi_{\mathcal B}(v)=\lambda v= \big(\phi_{\mathcal B}\big)^{-1}\lambda \, \phi_{\mathcal B}(v), $$ 即 $$ A\phi_{\mathcal B}(v)=\lambda \phi_{\mathcal B}(v). $$ 這表明 $ \lambda $ 是 $ A $ 的一個特徵值。因此, $ \lambda $ 是 $ \tau $ 的一個特徵值若且唯若它是 $ A $ 的特徵值。證明因而完畢。
命題5.3.4 與不同的特徵值對應的特徵向量是線性獨立的, 即若 $ v_j\in {\mathcal E}_{\lambda_j} $, $ j=1,\ldots, k $, 則 $ \{v_1,\ldots, v_k\} $ 線性獨立。特別地, 若 $ \lambda_1,\,\ldots,\, \lambda_k $ 是線性算子 $ \tau\in {\mathcal L}(V) $ 不同的特徵值, 則 $$ {\mathcal E}_{\lambda_j}\,\cap\, {\mathcal E}_{\lambda_\ell}= \{0\}. $$
證明: 若 $ v_j $, $ j=1,\ldots, k $ 是線性相依的, 則在所有的非平凡的線性組合為零的式子中, 有一個最短的式子, 為 \begin{equation} \label{eq:eigen} \alpha_1v_1+\ldots + \alpha_kv_k= 0. \end{equation} 將 $ \tau $ 作用在\eqref{eq:eigen}, 我們便得到 $$ \alpha_1\tau(v_1)+\ldots + \alpha_k\tau(v_k)= 0, $$ 即 $$ \alpha_1\lambda_1v_1+\ldots + \alpha_k\lambda_kv_k= 0. $$ 另一方面, 我們若將\eqref{eq:eigen}兩邊乘上 $ \lambda_1 $, 再與上式相減便得到 $$ \alpha_2(\lambda_2-\lambda_1)v_2+\ldots + \alpha_k(\lambda_k-\lambda_1)v_k= 0. $$ 但這是一個更短的線性組合為零的式子, 故所有 $ \alpha_j $, $ j= 2,\ldots, k $ 全為零; 將之代回\eqref{eq:eigen}, 因而得到 $ \alpha_1=0 $。 證明因而完畢。
由於 $ \tau $ 的特徵多項式 $ C_\tau(x) $ 是所有初等因子的乘積, 而 $ \tau $ 的極小多項式為 $$ m_\tau(x)= p_1^{e_1}(x)\,\ldots\, p_n^{e_n}(x), $$ 故 $ m_\tau(x)\,\Big|\, C_\tau(x) $。 因此得到下面重要的定理 :
定理5.3.1: 若 $ \tau\in {\mathcal L}(V) $, 則
- 極小多項式 $ m_\tau(x) $ 與特徵多項式 $ C_\tau(x) $ 有相同的素因子。
- (Caley-Hamilton定理) $ m_\tau(x)\,\Big|\, C_\tau(x) $, 即 $ C_\tau(\tau)=0 $。
5.4. Jordan標準形式
有限維向量空間的每個線性算子 $ \tau $ 都有標準形式, 即所有有理標準形式的矩陣的全體組成一個標準形式集合。 顯然, 有理標準形式還不是像我們所指望的那樣有具體簡單的形式。對一些重要的特殊的形式, 我們可以得到更為簡單的標準形式。 這種重要的特殊的情形是 : 若算子 $ \tau\in {\mathcal L}(V) $, 它的極小多項式可以分解為線性因子的乘積, 即 \begin{equation} \label{eq:minimal} m_\tau(x)= (x-\lambda_1)^{e_1}\cdots\,(x-\lambda_n)^{e_n}. \end{equation} 當一個多項式在體 $ F $ 上分解為線性因子的乘積時, 稱多項式可以在 $ F $ 上分裂 (split)。
若體 $ F $ 上任一非常數的多項式的根仍在 $ F $ 中, 稱 $ F $ 為代數封閉的(algebraic closed)。 因此, 在代數封閉域上不可約多項式只有線性多項式。 故任意非常數多項式在 $ F $ 上分裂。 代數封閉體簡單的例子是複數體。 回顧有理標準形式 $ \langle v_{j,\ell}\rangle $ 是循環子模, 其首一階為初等因子 $ p_j^{e_{j,\ell}}(x) $。 由於對 $ p_j^{e_{j,\ell}}(x) $ 了解甚少, 以致作為 $ V $ 的 $ \tau $ -循環子空間, 選取基底為 $$ {\mathcal B}_{j,\ell}=\big(v_{j,\ell},\, \tau_{j,\ell}(v_{j,\ell}),\,\ldots \, \tau_{j,\ell}^{d_{j,\ell}-1}(v_{j,\ell})\big). $$ 當極小多項式是\eqref{eq:minimal}時, 其初等因子為 $$ p_j^{e_{j,\ell}}(x)= (x-\lambda_j)^{e_{j,\ell}}. $$ 這時, 我們可以更有效地選取基底。 由於 $$ {\mbox{dim}}(\langle v_{j,\ell}\rangle)= {\mbox{deg}}\big(p_j^{e_{j,\ell}}(x)\big), $$ 不難看出 $$ {\mathcal G}_{j,\ell}=\big(v_{j,\ell},\, (\tau_{j,\ell}-\lambda_j)(v_{j,\ell}),\,\ldots \, (\tau_{j,\ell}-\lambda_j)^{e_{j,\ell}-1}(v_{j,\ell})\big) $$ 也是 $ \langle v_{j,\ell}\rangle $ 的一組基底。 記 $ {\mathcal G}_{j,\ell} $ 中第 $ k $ 個向量為 $ b_k $, 則當 $ k=0,\,\ldots,\, e_{j,\ell}-2 $ 時, \begin{equation*} \begin{split} \tau_{j,\ell}(b_k)\,=&\, \tau_{j,\ell}\big[(\tau_{j,\ell}-\lambda_j)^k(v_{j,\ell})\big]\\ =&\, (\tau_{j,\ell}-\lambda_j+\lambda_j) \big[(\tau_{j,\ell}-\lambda_j)^k(v_{j,\ell})\big]\\ =&\, (\tau_{j,\ell}-\lambda_j)^{k+1}(v_{j,\ell})+ \lambda_j(\tau_{j,\ell}-\lambda_j)^k(v_{j,\ell})\\ =&\, b_{k+1}+ \lambda_jb_k; \end{split} \end{equation*} 當 $ k= e_{j,\ell}-1 $ 時, 應用 $$ (\tau_{j,\ell}-\lambda_j)^{k+1}(v_{j,\ell})= (\tau_{j,\ell}-\lambda_j)^{e_{j,\ell}}(v_{j,\ell})=0, $$ 可得 $$ \tau_{j,\ell}(b_{e_{j,\ell}-1})= \lambda_j b_{e_{j,\ell}-1}. $$ 因此, 相對於基底 $ {\mathcal G}_{j,\ell} $, $ \tau_{j,\ell} =\tau\big|_{\langle v_{j,\ell}\rangle} $ 所對應的矩陣為 $ e_{j,\ell}\times e_{j,\ell} $ 方陣 : \begin{equation*} G(\lambda_j,e_{j,\ell})=\left[\begin{array}{ccccc} ~\lambda_j~&0 &\cdots &\cdots & 0\\ 1 &~\lambda_j~ &~\cdots~ &~\cdots~ &0\\ 0&1 &\ddots &\ddots &\vdots \\ \vdots &\vdots &\ddots &\ddots &0\\ 0&0 &\cdots &1 &~\lambda_j~ \end{array} \right]. \end{equation*} 這個矩陣稱為 $ \lambda_j $ 的Jordan 塊 (Jordan block)。即Jordan塊為在主對角線上元素為 $ \lambda_j $, 在次對角線上元素為 $ 1 $, 其餘元素為零。 於是在選取新的基底之後, 我們得到類似於定理5.2.2的如下定理 :
定理5.4.1: 若算子 $ \tau\in {\mathcal L}(V) $ 的極小多項式在體 $ F $ 上可分裂, 即 \begin{equation*} m_\tau(x)= (x-\lambda_1)^{e_1}\cdots\,(x-\lambda_n)^{e_n}. \end{equation*} 則 $ V $ 可分解為 \begin{equation*} V= \big(\langle v_{1,1}\rangle \,\oplus\,\ldots\,\oplus \langle v_{1,k_1}\rangle\big)\, \oplus\, \cdots\,\oplus\,\big((\langle v_{n,1}\rangle \,\oplus\,\ldots\,\oplus \langle v_{n,k_n}\rangle\big), \end{equation*} 這裡 $ \langle v_{j,\ell}\rangle $, $ j=1,\ldots, n $, $ \ell=1,\ldots, k_n $ 是 $ V $ 的 $ \tau $ -循環子空間; $ \tau_{j,\ell}=\tau\big|_{\langle v_{j,\ell}\rangle} $ 的極小多項式為 $ V $ 的初等因子 $$ \min\big(\tau_{j,\ell}\big)= (x-\lambda_j)^{e_{j,\ell}}, $$ 這裡 $$ e_j= e_{j,1}\,\ge\, e_{j,2}\,\ge\, \cdots\, \ge\, e_{j,k_j}\,\ge \, 1,\qquad j=1,\ldots, n. $$ 這些初等因子由 $ \tau $ 唯一決定。 令 $$ {\mathcal G}_{j,\ell}=\big(v_{j,\ell},\, (\tau_{j,\ell}-\lambda_j)(v_{j,\ell}),\,\ldots \, (\tau_{j,\ell}-\lambda_j)^{e_{j,\ell}-1}(v_{j,\ell})\big) $$ 是 $ \langle v_{j,\ell}\rangle $ 的一組基底, 則與 $ \tau $ 相對應的矩陣在基底 $$ {\mathcal G}=\big({\mathcal G}_{1,1},{\mathcal G}_{1,2},\ldots, {\mathcal G}_{n,k_n}\big) $$ 下是分塊對角矩陣 \begin{equation*} [\tau]_{\mathcal B}=\left[\begin{array}{ccccccc} G(\lambda_1,e_{1,1})&&&&&&\\ &\ddots &&&&&\\ && G(\lambda_1,e_{1,k_1}) &&&&\\ &&&\ddots &&&\\ &&&& G(\lambda_n,e_{n,1}) &&\\ &&&&&\ddots &\\ &&&&& G(\lambda_n,e_{n,k_n}) \end{array} \right]. \end{equation*} 上式右邊的矩陣稱為 $ \tau $ 的Jordan標準形式(Jordan canonical form)。
用矩陣的語言, 在代數封閉域 $ F $ 上每個矩陣都相似於唯一的一個 Jordan標準形式, 也就是所有的Jordan標準形式的確組成了在相似意義下的標準形式集合。
若 $ \tau $ 有Jordan標準形式 $ G $, 則 $ G $ 中主對角線上元素就是特徵多項式 $ C_\tau(x) $ 的根(包括重數)。 也就是, $ G $ 中主對角線元素 $ \lambda_j $ 出現的次數就是特徵多項式的根 $ \lambda_j $ 的重數。定理5.4.1是線性代數的另一個高峰。 從幾何的意義來講, 它徹底解決了在代數封閉體上的一個向量空間在一個線性變換下的分解。 從代數的角度來講, 它徹底解決了在代數封閉體上的矩陣在相似變換下的分類。
5.5. 內積空間上算子的標準形式
1. 在2.4節及3.3節中介紹了內積空間以及其上的三種重要算子 : 自共軛算子、酉算子及正規算子, 還討論了它們的一些簡單性質。
若 $ V,\,W $ 為 $ F $ 上有限維內積空間, $ \tau\in {\mathcal L}(V) $, 則存在唯一的線性變換 $ \tau^\ast\,:\,W\,\rightarrow\, V $ 定義為 $$ \langle\tau(v),\,w\rangle= \langle v,\, \tau^\ast(w)\rangle, $$ 這裡 $ v\in V $, $ w\in W $。 $ \tau^\ast $ 稱為 $ \tau $ 的共軛算子。
若 $ V $ 是內積空間, $ \tau\in {\mathcal L}(V) $, 則 $ \tau $ 稱為自共軛算子(或埃爾米特), 如果 $ \tau= \tau^\ast $。 算子 $ \tau $ 稱為酉算子, 如果 $ \tau $ 是雙射而且 $ \tau^{-1}= \tau^\ast $。 如果 $ \tau\,\tau^\ast=\tau^\ast\tau $, 則 $ \tau $ 稱為正規算子。我們現在來看看這些算子的特徵值和特徵空間。
命題5.5.1: 若 $ \tau $ 是自共軛, 則 $ \tau $ 的特徵多項式 $ C_\tau(x) $ 的根都是實的。換句話說, 特徵值全是實的。
證明: 先設 $ V $ 是複向量空間, $ \lambda $ 是 $ V $ 的特徵多項式 $ C_\tau(x) $ 的根, 則有 $ v\,\ne \, 0 $ 使得 $ \tau(v)=\lambda v $。 於是 $$ \langle\tau(v),\,v\rangle= \langle \lambda v,\, v\rangle= \lambda\langle v,\, v\rangle. $$ 由於 $ \tau $ 是自共軛, 所以 $$ \langle\tau(v),\,v\rangle= \langle v,\, \tau(v)\rangle= \langle v,\, \lambda v\rangle= \bar \lambda \langle v,\, v\rangle. $$ 故 $ \lambda = \bar \lambda $, 即 $ \lambda \,\in \, \mathbb R $。
若 $ V $ 是實向量空間, 則 $ \tau $ 對 $ V $ 的某一組基底其對應的矩陣是實對稱矩陣 $ A $, 於是 $ C_\tau(x)= C_A(x) $。 因 $ A $ 是實對稱矩陣, 可看作複向量空間 $ {\mathbb C}^n $ 的一個自共軛線性算子, 如上面所證, 其特徵多項式的根是實數。 將 $ A $ 看作實的或複的矩陣, 其特徵多項式是一樣的, 命題因而證畢。
命題5.5.2: 若 $ \tau $ 是酉線性算子, 則 $ \tau $ 的特徵值的絕對值為 $ 1 $。
證明: 若 $ \tau $ 為酉算子及 $ \tau(v)= \lambda v $ 則 $$ \lambda\,\bar\lambda \langle v,\,v\rangle= \langle \lambda v,\, \lambda v\rangle= \langle \tau(v),\, \tau(v)\rangle= \langle v,\,v\rangle. $$ 故 $ | \lambda|^2=1 $, 即 $ | \lambda|=1 $。
命題5.5.3: 若 $ \tau $ 為正規算子, $ \lambda,\,\mu $ 為 $ \tau $ 不同的特徵值, 則對應的特徵子空間互相正交。 特別地, 自共軛算子和酉算子的不同特徵值對應的特徵子空間互相正交。
證明: 若 $ \tau(v)= \lambda v $ 及 $ \tau(w)= \mu w $, 這裡 $ \lambda\,\ne\,\mu $, 則 $$ \lambda \langle v,\,w\rangle= \langle \tau(v),\, w\rangle= \langle v,\, \tau^\ast(w)\rangle= \langle v,\,\bar\mu w\rangle=\mu \langle v,\,w\rangle . $$ 因為 $ \lambda\,\ne\,\mu $, 故 $ \langle v,\,w\rangle=0 $。 這裡用到 $ \tau^\ast(w)=\bar\mu w $, 參閱3.3節中正規算子的性質(5), 命題因而證畢。
前面的有理標準形式及Jordan標準形式一般不是對角矩陣, 什麼情況下可化為對角矩陣?
定義5.5.1: 若 $ V $ 是有限維內積空間, $ \tau\in {\mathcal L}(V) $, 若有 $ V $ 的正規正交基底 $ {\mathcal O} $ 使得 $ [\tau]_{\mathcal O} $ 是一個對角矩陣, 則稱 $ \tau $ 可正交對角化(orthogonal diagonalizable)。
定理5.5.1: 若 $ V $ 是有限維複內積空間。
- $ V $ 上一個線性算子 $ \tau $ 可以正交對角化若且唯若它是正規的。
- $ \tau $ 是 $ V $ 上的一個正規算子, 它是自共軛若且唯若它的特徵值均為實的。
- $ \tau $ 是 $ V $ 上的一個正規算子, 它是酉的若且唯若它的特徵值的絕對值均為 $ 1 $。
證明 : (a) 若 $ \tau $ 為是複內積空間 $ V $ 上的一個正規算子, 且 $ \tau $ 的極小多項式的素因子分解為 $$ m_\tau(x)= (x-\lambda_1)^{e_1}\cdots\,(x-\lambda_k)^{e_k}, $$ 則由准素模分解定理(Decomposition Theorem for Primary modules), $ V $ 可分解為 $$ V= V_1\,\oplus\,\ldots\,\oplus\, V_k. $$ 由3.3節中有關正規算子的命題3.3.5的(4), 我們有 \begin{equation*} \begin{split} V_j\,=&\, \big\{v\in V\,:\, (\tau-\lambda_j)^{e_j}(v)=0\big\}\\ =&\, \big\{v\in V\,:\, (\tau-\lambda_j)(v)=0\big\}={\mathcal E}_{\lambda_j}, \end{split} \end{equation*} $ j=1,\ldots, k $。 故 $ \tau\big|_{V_j} $ 的極小多項式為 $ x-\lambda_j $, 故 $ e_j=1 $, $ j=1,\ldots, k $。 因此 $$ V= {\mathcal E}_{\lambda_1}\,\oplus\,\ldots\,\oplus \,{\mathcal E}_{\lambda_k}. $$ 由命題5.5.3 知道, $ V $ 可分解為正交直和 $$ V= {\mathcal E}_{\lambda_1}\,\oplus_\perp\,\ldots\,\oplus_\perp \,{\mathcal E}_{\lambda_k}. $$ 所以將每個特徵空間的正規正交基底組合起來構造出由 $ \tau $ 的特徵向量組成的 $ V $ 的一個正規正交基底, 即 $ \tau $ 是可以正交對角化的。
反之, 若 $ \tau $ 是可以正交對角化, 則 $ V $ 有一個正規正交基底 $ {\mathcal O}=\{u_1,\ldots,u_k\} $ 其中 $ \tau(u_j)=\lambda_ju_j $, $ j= 1,\ldots, k $。 於是 \begin{equation*} \begin{split} \langle u_j,\,\tau^\ast(u_\ell) \rangle\,=&\, \langle \tau(u_j),\, u_\ell\rangle= \lambda_j\langle u_j,\, u_\ell\rangle\\ =&\, \lambda_{j}\delta_{j,\ell}=\lambda_\ell\delta_{j,\ell}=\langle u_j,\,\bar\lambda_\ell u_\ell \rangle, \end{split} \end{equation*} 所以 $ \tau^\ast(u_\ell) = \bar\lambda_\ell u_\ell $。 因此 \begin{equation*} \begin{split} \tau\,\tau^\ast(u_\ell)\,=&\, \bar\lambda_\ell \tau(u_\ell)= \bar \lambda_\ell\lambda_\ell u_j\\ =&\, \lambda_\ell \tau^\ast(u_\ell)=\tau^\ast\tau(u_\ell), \end{split} \end{equation*} 故 $ \tau $ 為正規算子。
(b). 已知自共軛算子是正規的, 則特徵值均為實的。反之, 若 $ \tau $ 是複內積空間 $ V $ 上的一個正規算子, 且其特徵值均為實的, 則對應於 $ \lambda_\ell $ 的任何特徵向量 $ u_\ell $, 我們有 $$ \tau^\ast(u_\ell)= \bar\lambda_\ell u_\ell=\lambda_\ell u_\ell\,= \,\tau(u_\ell). $$ 由於這些 $ u_\ell $ 是特徵向量構成的基底, 故 $ \tau $ 為自共軛算子。
(c). 若 $ \tau $ 為酉算子, 則它的特徵值的絕對值均為 $ 1 $。 反之, 若 $ \tau $ 是複內積空間 $ V $ 上的一個正規算子, 且其特徵值之絕對值均為 $ 1 $, 則對應於 $ \lambda_\ell $ 的任何特徵向量 $ u_\ell $, 我們有 $$ \langle u_\ell,\,u_\ell \rangle= \lambda_\ell\bar\lambda_\ell \langle u_\ell,\,u_\ell \rangle= \langle \lambda_\ell u_\ell,\, \lambda_\ell u_\ell \rangle= \langle \tau(u_\ell),\, \tau(u_\ell) \rangle=\langle u_\ell,\, \tau^\ast \tau(u_\ell) \rangle. $$ 由於這些 $ u_\ell $ 是特徵向量構成的基底, 故 $ \tau^\ast=\tau^{-1} $, 因此 $ \tau $ 為酉算子。
定理因而證明完畢。
上面給出了複內積空間上線性算子 $ \tau $ 可正交對角化的充要條件是 $ \tau $ 為一正規線性算子。下面給出實內積空間上線性算子可正交對角化的充要條件。
定理5.5.2: 有限維實內積空間 $ V $ 上的一個線性算子 $ \tau $ 可正交對角化若且唯若 $ \tau $ 是自共軛。
證明 : 若 $ \tau $ 為是 $ V $ 上的自共軛算子, 則由命題5.5.1知 $ \tau $ 的極小多項式可在 $ \mathbb R $ 上分裂。 由3.3節中關於自共軛算子的命題3.3.2的(8)及命題5.5.3得到, 在 $ V $ 中存在一組由 $ \tau $ 的特徵向量構成的正規正交基底; 其證明類似於定理5.5.1之證明。 反方向我們用矩陣來證明 : 若 $ \tau $ 可正交對角化, 則 $ V $ 中存在一組正規正交基底 $ {\mathcal O} $, 使得 $ [\tau]_{\mathcal O} $ 對角化。 由於 $ [\tau]_{\mathcal O} $ 是實對稱, 所以 $$ [\tau^\ast]_{\mathcal O}= [\tau]^\ast_{\mathcal O}= [\tau]^T_{\mathcal O}= [\tau]_{\mathcal O}, $$ 即 $ \tau =\tau^\ast $。
定理5.5.1與定理5.5.2之矩陣形式如下。
定理5.5.3:
- 設 $ A $ 是一個複方陣, 則存在酉矩陣 $ U $ 使得 $ U\,A\,U^{-1} $ 是對角矩陣若且唯若 $ A $ 是正規的; 一個正規複方陣 $ A $ 是 Hermitian 若且唯若 $ A $ 的特徵值均為實的。一個正規複方陣 $ A $ 是酉矩陣若且唯若它的特徵值絕對值均為 $ 1 $。
- $ A $ 是一個實方陣, 則存在正交陣 $ O $ 使得 $ O\,A\,O^{-1} $ 是對角方陣若且唯若 $ A $ 是對稱的(見定理2.3.5)。
2. 上面給出了正規算子與自共軛算子分別在複數體 $ {\mathbb C} $ 及實數體 $ {\mathbb R} $ 上的標準形式是對角矩陣。 現在來給出實數體 $ {\mathbb R} $ 上的酉算子的標準形式。
若 $ \tau $ 是一個實酉算子, 則 $ \sigma=\tau+\tau^\ast=\tau+\tau^{-1} $ 是自共軛算子, 故有一實特徵值的完備集合, 如在定理5.5.1中那樣, $ V $ 可分解為 $$ V= {\mathcal E}_{\lambda_1}\,\oplus_\perp\,\ldots\,\oplus_\perp\, {\mathcal E}_{\lambda_k}, $$ 這裡 $$ {\mathcal E}_{\lambda_j}=\big\{v\in V\,:\,(\tau+\tau^{-1}-\lambda_j)(v)=0\big\}, $$ 或乘以 $ \tau $, $$ {\mathcal E}_{\lambda_j}=\big\{v\in V\,:\,(\tau^2-\lambda_j\tau+1)(v)=0\big\}. $$ 若 $ \lambda_j=2 $, 則由於 $ \tau $ 是正規的, 因而有 $$ {\mathcal E}_{2}=\big\{v\in V\,:\,(\tau-1)^2(v)=0\big\}=\big\{v\in V\,:\,(\tau-1)(v)=0\big\}. $$ 若 $ \lambda_j=-2 $, 我們有 $$ {\mathcal E}_{-2}=\big\{v\in V\,:\,(\tau+1)^2(v)=0\big\}=\big\{v\in V\,:\,(\tau+1)(v)=0\big\}. $$ 故算子 $ \tau $ 在特徵空間 $ {\mathcal E}_{2} $ 及 $ {\mathcal E}_{-2} $ (如存在的話)上的限制分別就是乘以 $ +1 $ 或 $ -1 $。
當 $ \lambda_j\,\ne\,\pm 2 $ 時, 若 $ v\in {\mathcal E}_{\lambda_j} $, 考慮 $ {\mbox{span}}\{v,\, \tau(v)\} $。 這是 $ {\mathcal E}_{\lambda_j} $ 中的一個不變子空間, 因為 $$ \tau(\tau(v))=\tau^2(v)= \lambda_j\tau(v)-v. $$ 於是 $$ {\mathcal E}_{\lambda_j}= {\mbox{span}}\{v,\, \tau(v)\}\,\oplus_\perp\, {\mbox{span}}\{v,\, \tau(v)\}^\perp. $$ 連續這樣的步驟, 每個 $ {\mathcal E}_{\lambda_j} $ 分解為二維子空間的正交直和, $ \tau $ 在每個子空間上是一個實酉算子 : $$ V= {\mathcal E}_{2}\,\oplus_\perp\, {\mathcal E}_{-2}\,\oplus_\perp\, {\mathcal D}_1\,\oplus_\perp\, \cdots\, \oplus_\perp {\mathcal D}_m, $$ 這裡 $ {\mbox{dim}}{\mathcal D}_i= 2 $, $ i=1,\ldots,m $, 每一項在 $ \tau $ 下不變。
於是, 我們只要算出在二維空間 $ {\mathcal D} $ 上的實酉算子 $ \tau $ 的矩陣即可。 由於對 $ {\mathcal D} $ 的任意正規正交基底, $ \tau $ 的矩陣是正交的, 故若 由於 $ {\mbox{det}}([\tau])=1 $ ,即 $ ad-bc= 1 $ , 解這些方程式, 我們得到 $ d=a $, $ c= -b $, 於是 \begin{equation*} [\tau]=\left[\begin{array}{cc} ~a~ ~&b~\\ c&d \end{array}\right], \end{equation*} 則 $$ a^2+b^2= 1,\quad c^2+d^2= 1,\quad ac+ db=0. $$ 由於 $ {\mbox{det}}([\tau])=1 $ ,即 $ ad-bc= 1 $ , 解這些方程式, 我們得到 $ d=a $, $ c= -b $, 於是 \begin{equation*} [\tau]=\left[\begin{array}{cc} a& b\\ ~-b~ &~a~ \end{array}\right]. \end{equation*} 但 $ (a,\,b) $ 是 $ {\mathbb R}^2 $ 中的單位向量, 因此 $ (a,\,b)=(\cos\theta, \,\sin\theta) $, 這裡 $ \theta\in {\mathbb R} $, 因而 \begin{equation*} [\tau]=\left[\begin{array}{cc} ~\cos\theta~ & ~\sin\theta~ \\ ~-\sin\theta~ & \cos\theta \end{array}\right]. \end{equation*}
歸納起來, 我們得到下面的定理 :
定理5.5.4: 若 $ \tau $ 是有限維實內積空間 $ V $ 上的一個酉算子, 則 $ V $ 有一組正規正交基底, 使得 $ \tau $ 的矩陣有分塊形式 \begin{equation} \label{eq:unitary} \left[\begin{array}{ccccccc} I_{m_1}&&&&&&\\ & -I_{m_2} &&&&&\\ && \cos\theta_1 & \sin\theta_1 &&&\\ && -\sin\theta_1 &\cos\theta_1 &&&\\ &&&& \ddots &&\\ &&&&& \cos\theta_k &\sin\theta_k \\ &&&&&- \sin\theta_k & \cos\theta_k \end{array} \right]. \end{equation} 這裡 $ I_{m_j} $, $ j=1,2 $ 是 $ m_j\,\times m_j $ 單位矩陣。
定理5.5.4的矩陣形式可以寫成如下定理 :
定理5.5.5: 若 $ A $ 是正交矩陣, 則存在正交矩陣 $ O $, 使得 $ O\,A\,O^{-1} $ 是形如\eqref{eq:unitary}的矩陣。
5.6. 附記
在5.1節中已經說到, 本講是將體 $ F $ 上的向量空間 $ V $ 看成 $ F $ 上多項式環 $ F[x] $ 上的模, 於是上一講中的結果可以翻譯成為向量空間的語言, 這就得到一系列十分重要的分解定理。
在4.1節中, 還說到環 $ R $ 上的一個 $ R $ -模, 當 $ R={\mathbb Z} $ (整數環)時, 則 $ {\mathbb Z} $ -模就是Abel群, 也就是可以將Abel群看作 $ {\mathbb Z} $ -模。於是也可以將上一講中的結果翻譯成為Abel群的語言, 也可以得到十分重要的分解定理。
如果 $ G $ 是一個有限生成的Abel群, 則 $ G $ 可以視為一個有限生成的 $ {\mathbb Z} $ -模。 由定理4.3.1, $ G $ 可以分解為一個撓模 $ G_{tor} $ 和一個自由 $ {\mathbb Z} $ -模 $ G_{free} $ 的直和。 設 $ G_{free} $ 的秩為 $ r $, 則 $ G_{free}\,\approx\, {\mathbb Z}^r $。
若 $ G_{tor} $ 也是有限生成的。設 $ x_1,\,\ldots\, x_m $ 是它的一組生成元素, 於是 $ G_{tor} $ 的每一個元素都可以用這組生成元來素表示; 由於這些生成元的階都是有限的, 所以, $ G_{tor} $ 是一個有限Abel群。
由定理4.3.2., $ G_{tor} $ 的階為 $ \mu=p_1^{e_1}\,\ldots\,p_n^{e_n} $, 這裡 $ p_j $, $ j=1,\ldots,n $, 為不同質數, 則 $ G_{tor} $ 可分解為 $$ G_{tor}= G_{p_1}\,\oplus\,\ldots\,\oplus\, G_{p_n}, $$ 這裡 $ G_{p_j}= \{v\in G_{tor}\,:\, p_j^{e_j}(v)=0\} $, 即 $ G_{p_j} $ 為 $ G_{tor} $ 的階為 $ p_j^{e_j} $ 的子群, 換句話說, $ G_{p_j} $ 為 $ G_{tor} $ 的Sylow $ p_j $ -子群, $ j=1,\ldots,n $。
這裡要注意的是: 對於有限Abel群 $ G $ 有兩個階的概念, 其一指 $ |G| $, 即 $ G $ 中元素的個數; 其二指 $ G $ 作為 $ {\mathbb Z} $ -模的零化子的生成元素。 一般而言, 這兩個階是不同的。在上一段的討論中所講的階是指後者。 回顧群 $ G $ 的Sylow $ p $ -子群是指 $ G $ 的階為 $ p^m $ 的子群, 其中 $ p^m \big| |G| $, 且 $ p^{m+1} \nmid |G| $。 Sylow $ p $ -子群總是存在的, 因此在上一段的討論中, $ G_{p_j} $ 必是 $ G_{tor} $ 的Sylow $ p_j $ -子群, $ j=1,\ldots,n $。
由定理4.3.3., 有限Sylow $ p_j $ -子群, $ p_j $ 為質數, $ j=1,\ldots,n $, 又可以分解成一些循環 $ p_j $ -子群的直和, 即 $$ G_{p_j}= G_{j, 1}\,\oplus\,\ldots\,\oplus\, G_{j,k_j},\qquad j= 1,\ldots, n, $$ 這裡 $ G_{j, 1} $ 是階為 $ p_j^{e_{j,\ell}} $ 的循環 $ p_j $ -子群, $ \ell= 1,\ldots, k_j $, 且滿足 $$ e_j= e_{j, 1}\,\ge\,e_{j,2}\,\ge\, \cdots\,\ge \,e_{j,k_j}. $$ 換句話說 $$ p_j^{e_{j, j_k}}\,\big|\, p_j^{e_{j, j_{k-1}}}\,\big|\, \cdots\,\big| \,p_j^{e_{j,1}}. $$ 歸納起來, 有以下的定理
定理5.6.1: (有限生成的Abel群的分解定理) 若 $ G $ 是一個有限生成的Abel群, 則 $ G $ 可以分解成 $ r $ 個無限循環子群及一些有限循環 $ p_j $ -子群的直和。 $ r $ 和有限循環 $ p_j $ -子群的階 $ p_j^{e_{j,\ell}} $, $ j=1,\ldots,n $, $ \ell= 1,\ldots, k_j $, 是 $ G $ 上一組完全不變量, 即兩個有限生成Abel群同構若且唯若它們的不變量完全相同。 這就是第四講中主理想整環上有限生成模的分解定理譯成有限生成Abel群時的語言。由此可以看出, 這完全解決了有限生成Abel群的分類問題。 當然這些內容不屬於線性代數的範圍, 所以作為附記, 用以顯示模理論的有力作用。
參考文獻
---本文作者龔昇任教於中國科技大學; 張德健任教於美國 Georgetown University 數學系---