發刊日期 |
2015年3月
|
---|---|
標題 | 華羅庚關於矩陣標準型的工作介紹 |
作者 | |
關鍵字 | |
檔案下載 | |
全文 |
華羅庚的矩陣技巧使得邀請他1946年去普林斯頓高等研究院訪問的 H. Weyl 十分賞識,
Weyl 曾說:「華羅庚玩矩陣就如玩數字一樣。」 緣起華羅庚 (1910$\sim$1985), 江蘇金壇人, 二十世紀中國最有影響力的數學家之一。 華羅庚是自學成才的大數學家, 他的故事曾激勵了一代又一代的學生走上數學研究的道路。 作為一名學者, 他對後人特別是華人的影響是無法估量的。
關於華羅庚的傳奇人生, 他的學生王元曾經寫過一本很好的傳記
對於華羅庚的數學工作, 已經有了許多介紹, 特別的, 可見華羅庚的論文選集 華先生很重視做學問需要有"看家功夫"。 所謂看家功夫指的是做科研時必不可少的最基本而有用的本事。 據他所說, 他扎實的看家功夫主要來源於三部經典著作。 一是 G. Chrystal 的《代數學》, 二是 E. Landau 的《數論教程》 (三大卷), 三是 W. H. Turnbull 與 A. C. Aitken 合著的《矩陣標準型理論引論》。 他說, 《代數學》使他學會了計算技巧, 《數論教程》使他獲得了從事數學研究的分析功底, 而《矩陣標準型理論引論》雖是一本薄薄的書, 卻是幫助他後來完成矩陣幾何和複分析 巨大研究成果的基本工具。}
需要補充的是, 對華羅庚後來的工作影響至深的還有 H. Weyl 的經典著作《古典群》 華羅庚在討論班和日常談話中有許多觀點是大家熟知的, 例如他把"班門弄斧"反其道而行之, 主張 "弄斧一定到班門", 即研究工作一定要與大師交手, 才會有所提高。 他主張讀書要"從薄變厚, 再從厚變薄", 並舉例說他花了兩年的功夫念 Weyl 的群表示論的書, 終於弄懂了其中的精髓。我們在他的著作《多複變數函數論中的典型域的調和分析》中看到他是如何把群表示加以消化, 用自己獨特的矩陣技巧表達出來。
由此我們應該認識到, 對於作為數學家的華羅庚來說,
他最重要的才能之一是他在運用矩陣技巧方面的精深造詣。
如果不瞭解這一點, 就無法理解華羅庚 (及其學派)
在多元複變函數論上的成功。3
3
正如馮克勤在
華羅庚對矩陣論有許多貢獻, 本文主要討論他在矩陣的標準型方面的工作。
萬哲先在華羅庚的論文選集 華羅庚關於矩陣幾何和多元複變函數論的研究, 還促使他研究矩陣的分類問題, 例如, 複對稱矩陣和斜對稱矩陣在酉群相合下的分類, 一對 Hermite 矩陣在相合下的分類, 以及 Hermite 矩陣在正交群相合下的分類。
這個概括是不完全的, 特別是, 沒有提到華羅庚在 1960 年代初用中文發表
(但結果早在 1940 年代就已經得到) 的兩篇
工作
華羅庚在 1940 年代的西南聯大完成了這些工作,
這期間他還獨立於 C. L. Siegel 開展了
多元複變函數自守函數論的研究, 並從中進一步開創了矩陣幾何學這一新領域。
這些研究正是華羅庚關於矩陣標準型工作的背景與動機所在。
事實上, 華羅庚在矩陣標準型方面的工作
主要包含在多元複變函數論與矩陣幾何的文章中, 見
1940年恰好也是華羅庚數學研究生涯中的一個分水嶺。
1940年以前, 他 (追隨德國、英國與俄國學派) 從事當時熱門的解析數論研究;
1940年以後, 他獨立地開展了多元複變函數論與矩陣幾何學的研究。
借助于徐利治的上述總結, 也許可以這樣簡單地概括:在1940年以前, 華羅庚的數學研究主要是
受到 Landau《數論教程》的影響; 在1940年以後, 對華羅庚影響
越來越深的是 Turnbull 與 Aitken的《矩陣標準型理論引論》。我們要介紹的就是,
後一影響在華羅庚的工作 內容介紹在具體介紹華羅庚的數學工作之前, 我們先來瞭解一下 他在1940年以前的數學生涯以及當時的整個時代背景 (注意到 1937$\sim$1945 在中國近代史上的特殊烙印), 這就是第一節的主要內容。 華羅庚自學成才的故事應該是家喻戶曉的, 但筆者深為觸動以至於在此忍不住想要舊事重提。 相信這一則小故事必定會引起讀者 (特別是在學學生) 的反省與深思。 對於這一故事已經熟悉的讀者可以直接跳過。
在第二節我們將回顧一下矩陣標準型方面的經典結果,
這也相當於提供了另一個觀點來看待本科線性代數的主要結果。
這裏我們特別要介紹 K. Weierstrass 與 G. Frobenius 的重要貢獻, 從某種意義上說,
正是他們的工作一起奠定了現在的線性代數之基礎,
這一點也許很值得瞭解 (參見
在第三節我們將用七個小節分別詳細介紹華羅庚論文
在第四節我們將要介紹 J. Williamson, 這個名字在第三節中反覆出現, 因為
華羅庚在矩陣標準型方面的許多工作都曾被 Williamson 研究過。
從某種意義上說, Williamson 是華羅庚在矩陣標準型工作方面的一個潛在對手,
每當我們提及華羅庚在矩陣標準型方面的諸多工作時, 就必定要反覆提到 Williamson 的早期工作,
正如每當我們討論華羅庚在多元複變函數論方面的開創性工作時就必定要提到 Siegel 的
著名論文辛幾何 (見 1. 插入:1940年以前的華羅庚如王元、楊德莊《華羅庚的數學生涯》一書開篇所說的: 華羅庚是一個自學成才的數學家。他在初中畢業後僅念了半年職業高中, 即在家 自學數學。他在家鄉江蘇金壇所能見到的數學書籍只有一本《大代數》5 5 這裡的《大代數》當指後來在國內普遍採用的《范氏大代數》, 這是他1926年在上海參加珠算比賽獲得冠軍後用獎金所買的。 一本《解析幾何》, 以及一本約五十頁的《微積分》。此外還有兩本與數學有點關係的雜誌《科學》與《學藝》。 華羅庚在家一邊自學, 一邊寫過幾篇文章, 都屬於初等數學範圍。}
很難想像, 受教育如此之少的華羅庚後來竟憑藉自己的勤奮與天才而成為中國數學的一根頂樑柱。
華羅庚的人生轉折點出現在1930年。那一年他在《科學》上發表了
他的第二篇數學論文蘇家駒之代數的五次方程式解法不能成立之理由,
在這篇論文中, 華羅庚找出了蘇家駒1926年發表在《學藝》上的論文
代數的五次方程式之解法的錯誤。6
6
關於華羅庚這篇論文的創作過程,
見李文林 那時清華數學系最引人注意的人物, 當數華羅庚。羅庚江蘇金壇人, 和培經同鄉。 羅庚初中畢業後輟學在家, 就自修數學, 因為同鄉關係, 他與培經通信, 咨詢數學問題。 有一期《學藝》雜誌上一位先生"證明"五次方程式可解, 編者竟登載了。 羅庚能把錯誤找出, 因此數學系決定聘他為圖書管理員。 他1931年來清華, 辦公桌放在系主任熊先生辦公室外面, 不久就成了系裏的中心人物。 羅庚是一個十分活躍的人, 凡數學討論, 系內人事, 他無不參與。 他是確有數學天才的, 每天工作十幾個小時, 所以短期內便有文章在國外雜誌發表。 他的腿因幼時患傷寒症而跛, 又因沒有上過大學, 和大家出身不同, 以致有高度的不安全感。 他在數論、代數、多元複變函數論, 都有重要的貢獻。關於他的故事很多。 記得有一次, 他的一篇文章, 經某德國雜誌接受, 他站在科學館前, 逢人握手, 告此喜信。 在清華期間, 華羅庚一邊工作一邊學習。 當時算學系的教授有:研究單複變函數論的熊慶來, 研究數論的楊武之 (1896$\sim$1973), 研究微分幾何的孫光遠 (1900$\sim$1979) 以及 主要擔任基礎課教學的鄭桐蓀 (1887$\sim$1963), 教員有 周鴻經 (1902$\sim$1957), 唐培經 (1903$\sim$1988)。 學生中亦不乏佼佼者, 除了研究生陳省身與吳大任 (1908$\sim$1997) 之外, 還有 本科生莊圻泰 (1909$\sim$1997), 許寶騄 (1910$\sim$1970), 柯召 (1910$\sim$2002), 徐賢修 (1912$\sim$2002) 等。 華羅庚與這些精英一起聽課學習, 切磋琢磨, 受益良多。 因為他更多地得到了楊武之的指導, 所以他在此期間的興趣主要在數論。 楊武之, 1923$\sim$1928 年在芝加哥大學師從於美國代數與數論大家 L. E. Dickson (1874 $\sim$1954)。 學成歸來後, 在中國播灑下近世代數與數論的種子。 在 Dickson 的指導下, 楊武之在 1928 年的博士論文中證明了這樣的結果: 每個正整數都是九個金字塔數之和7 7 參見林開亮、張愛仙, 楊武之的九金字塔數定理,《數學傳播》, 2014年, 38卷 4期, 42-52。。 所謂金字塔數, 就是形如 ${{n+1}\choose{3}}=(n^3-n)/6$ $(n=1,2,3,\ldots)$ 的數。 這個結果是著名的 Lagrange 四平方和定理 (即每個正整數都是四個完全平方數之和) 的一個變體。 楊武之的這一堪與 Lagrange 定理相媲美的結果一定深深地打動了華羅庚, 這將他引向更一般的華林問題 (Waring's problem)。 華羅庚在清華讀到了 E. Laudau (1877$\sim$1938) 的一些優秀數論著作 (參照前面所引徐利治的話), 並對 Hardy-Littlewood-Ramanujan 的圓法與堆壘數論做了深刻的分析。 此外, 1935$\sim$1936年, 清華還邀請到法國數學家 J. Hadamard (1865$\sim$1963)與美國數學家 N. Wiener (1894$\sim$1964) 來校講學, 這使華羅庚受益良深。
1936年, 中國文化基金會資助華羅庚去英國劍橋大學進修, 由於資金有限, 他不是正式的研究生,
而是一個訪問學者。8
8
華羅庚選擇劍橋也許是因為受到 G. H. Hardy (1877$\sim$1947) 的吸引與
Wiener 的舉薦。
Hardy 與牛津大學的數論專家 J. E. Littlewood (1885$\sim$1977) 由於給出了 Hilbert-Waring 定理的定量化證明,
一起成為解析數論的領軍人物。
Hardy 一生最得意的發現不是某個數學結果, 而是印度的傳奇數學家 S. Ramanujan (1887$\sim$1920)。
Wiener 希望,
華羅庚作為中國的傳奇數學家也能得到 Hardy 的賞識。
可惜華羅庚去劍橋的那兩年 Hardy 恰不在劍橋。
另外, 根據陳省身先生的看法, 華羅庚去劍橋追隨 Hardy 未必是最好的選擇, 陳省身認為,
如果華先生到漢堡跟隨 E. Artin 搞代數數論, 日後的成就也許會更大。見張奠宙 1937年7月7日, 日本對中國發動全面的侵華戰爭。 1938年4月, 清華、北大、南開三校遷往雲南昆明, 合併創立西南聯大。 1938年, 華羅庚從英國回國, 任西南聯大數學系教授。 1938$\sim$ 1940年, 華羅庚將自己關於華林問題及其推廣的主要工作系統整理, 寫成專著《堆壘素數論》。由於時值戰亂, 付梓艱難, 他將書稿寄給蘇聯科學出版社出版。 由於第二次世界大戰的影響, 該書推遲至1947年才由蘇聯出版, 而中文修訂版則遲至1957年才出版。中文版之後又被譯成匈牙利文、德文、英文, 該書是華羅庚的第一本數學專著, 也是華羅庚最有影響的數論工作之一。
1940 年前後, 華羅庚將工作重點從數論轉移到分析、代數與幾何,
具體地說, 即多元複變函數論與矩陣幾何學。
注意到, 華羅庚此前完全沒有涉足這些領域。
事實上, 矩陣幾何學是華羅庚從多元複變函數論的研究中單獨開闢出來的新領域, 而當時從事多元複變函數論的數學家屈指可數,
É. Cartan (1869$\sim$1951)與 C. L. Siegel (1896$\sim$1981) 是其中最有影響的人物, 但由於時值戰亂消息閉塞,
華羅庚對他們的工作知之甚少。
然而, 他憑藉深厚的矩陣功底在這一領域開拓出重要成果 (見 2. 矩陣的標準型之概論
矩陣的標準型這一課題由來已久, 揭開這一課題研究的是矩陣論的奠基人:
德國數學家 K. Weierstrass (1815$\sim$1897)。
第一次聽說這句話 --- 矩陣論的奠基人是 Weierstrass 而不是 A. Cayley (1821$\sim$1895) --- 的讀者也許會非常驚訝,
筆者第一次從 Thomas Hawkins 那裏聽到這個
說法時也有同樣的感受。
沒錯!
Hawkins 正是這麼說的 (見 通常 Cayley 被認為是矩陣論的奠基者。然而, 我在1977年的一篇文章中提議道, 雖然 Cayley 在1858年之前通過引進這一理論 (矩陣代數) 的一個方面確實發揮了特殊的作用, 但是對 Cayley 的工作如此定性則是一種歷史誤導。在賦予任何人這樣一個名稱的時候存在著 一個顯然的危險, 因為它採取的是一種過分簡單化了的歷史解釋。銘記這一警告, 我將提議, 就配得上矩陣論奠基人這一稱號的人來說, 這個人是 Weierstrass。} Hawkins 將 Weierstrass 對矩陣論的貢獻概括為以下兩點: 第一, Weierstrass 在矩陣的初等因子理論 (也就是我們通常所說的 Jordan 標準型理論) 的基本性貢獻, 而這是矩陣論的基石。 第二, Weierstrass 通過引入分析的技巧 (攝動法) 處理退化 (不可逆) 矩陣, 從而使得對矩陣論做嚴格的數學研究成為可能。 Hawkins 進一步指出, 從某種程度上說, 雖然 C. Jordan (1838$\sim$1922) 也取得了與 Weierstrass 同樣的成就, 但是就各自的工作對後世的影響來說, 作為十九世紀數學發展的核心人物的 Weierstrass, 其影響 (特別是在矩陣論方面通過他的學生 Frobenius (1849$\sim$1917)9 9 關於 Frobenius 的數學工作的一個全面介紹, 可以參見 Hawkins 的新著, The Mathematics of Frobenius in Context, Springer, 2013. 的推進) 要大得多。因此, 他認為 Weierstrass 是當之無愧的矩陣論之父。 牽扯到歷史的話題總難免有一點沉重和不肯定, 我們還是來考慮更為輕鬆易懂的具體數學吧!
先來復習一下線性代數中關於矩陣的標準型方面的一些經典結果, 我們從 Jordan 標準型開始。
Jordan 標準型考慮的是一個複方陣 $A$ 在相似變換 $A\,\to P^{-1}AP$ 下的標準型, 如前所述,
這裏的基本結果屬於 Weierstrass 與 Jordan,
我們表述如下10
10
這個定理幾乎可見於所有的線性代數或矩陣論的教材, 特別的,
見華羅庚 基本結果1 設複方陣 $A$ 的初等因子為 $(\lambda-\lambda_1)^{m_1},\ldots,(\lambda-\lambda_r)^{m_r}$, 則 $A$ 相似於一個下述形式的准對角矩陣11 11 我們用記號 $A_1\oplus\cdots\oplus A_n$ 表示對角塊依次為 $A_1,\ldots,A_n$ 的准對角陣。 $$J=J_{m_1}(\lambda_1)\oplus\cdots \oplus J_{m_r}(\lambda_r),$$ 這裏 $$J_m(\lambda)=\begin{pmatrix} \lambda &1&0&\cdots&0\\ 0& \lambda &1&\cdots&0\\ \vdots&\vdots& \ddots &\ddots&0\\ \vdots&\vdots&& \lambda &1\\ 0&0&\cdots&0& \lambda \\ \end{pmatrix}\in M(m,\mathbb{C}),$$ 而且 $J$ 由 $A$ 唯一確定, 至多在對角塊之間相差一個置換。 $J_m(\lambda)$ 稱為 Jordan 塊, 這些 Jordan 塊是由 $A$ 唯一確定的。
定理1有一個實數版本, 即實 Jordan 標準型, 見華羅庚 需要指出的是, 方陣之間的相似關係實際上有著極其自然的幾何背景: 基本的洞察是, 方陣 (或一般的矩陣) 其實是作用在向量空間之間的線性變換的 代數描述。因此, 從幾何的觀點來看, 線性空間與線性變換才是第一位的, 而線性變換在線性空間給定的一組基下的矩陣表示是第二位的 --- 因為前者是內蘊的, 而後者則依賴於所參考的那組基的選取。 這個依賴關係就體現為, 同一個線性變換在兩組基底之下對應的方陣是相似的。 因此, 當我們將方陣視為線性變換 (方陣 $A$ 對列向量的乘法給出一個線性變換) 時, 必須考慮方陣之間的相似關係。 這也就是相似關係之所以特別重要的原因。 另一方面, 方陣還可以視為雙線性型。對於方陣 $A$, 我們可以定義雙線性型 $f_A(x,y)=x'Ay$, 其中 $x,y$ 為列向量, $x'$ 表示 $x$ 的轉置。容易看出, 方陣 $A$ 與 $B$ 決定的雙線性型 $f_A$ 與 $f_B$ 等價 (雙線性之間的等價如何定義是自然的) 當且僅當存在可逆矩陣 $P$, 使得 $P'AP=B$。這就引出了矩陣相合的定義:兩個方陣 $A$ 與 $B$ 稱為相合的, 如果 存在可逆矩陣 $P$, 使得 $P'AP=B$。因此, 當我們將方陣視為雙線性型時, 一個頭等重要的問題就是確定矩陣在相合變換 $A\to P'AP$ 下的標準型。通常我們只考慮對稱的或反對稱的雙線性型12 12 一般問題由 V. V. Sergeichuk 在 Classification problems for system of forms and linear mappings, Math. USSR, Izvestiya 31 (3) (1988), 481-501中解決。 。所以, 對應的問題就一分為二: 分別確定對稱矩陣與反對稱矩陣在相合下的標準型。 在反對稱的情形, 結果比較簡單, 我們有下述一般結果: 基本結果2 設 $A$ 為複 (或實) 反對稱矩陣, 則 $A$ 複 (或實) 相合於一個下述形式的准對角矩陣 $$\underbrace{J_2\oplus \cdots \oplus J_2}_k\oplus 0,$$ 這裏 $$J_{2}=\begin{pmatrix} 0& 1 \\ -1&0 \end{pmatrix},$$ 而 $k$ 由 $A$ 唯一確定。 在對稱矩陣的情形, 複矩陣與實矩陣的情形有所不同, 對應的結果分別為: 基本結果3 設 $A$ 為複對稱矩陣, 則 $A$ 相合於一個對角陣 $[\underbrace{1,\ldots,1}_r,0,\ldots,0]$, 這裏 $r$ 由 $A$ 唯一確定。 基本結果4 設 $A$ 為實對稱矩陣, 則 $A$ 實相合於一個對角陣 $[\underbrace{1,\ldots,1}_p,\underbrace{-1,\ldots,-1}_q,0,\ldots,0]$, 這裏 $p,q$ 由 $A$ 唯一確定。 上述兩個結果實際上是關於複 (或實) 的二次型在等價關係下的標準型結果, 而且後一結果就是著名的 Sylvester 慣性定理 (其中$p,q$ 分別稱為正、負慣性指數), 它是解析幾何中討論二次曲線與二次曲面的仿射分類的代數基礎。 為了進一步研究的需要, 我們需要獲得矩陣在某種特定的變換下的標準型。 實際上, 這樣的問題極為常見。例如, 如果給定的空間 (不妨設是實的) 帶有一個度量因而成為了歐幾里得空間, 那麼我們所考慮的相似與相合應分別代之以實正交相似與實正交相合, 例如, 此時的基本結果 4 應代之以下述 : 基本結果5 設 $A$ 為實對稱矩陣, 則 $A$ 實正交相合於一個對角陣 $[\lambda_1,\ldots,\lambda_n]$, 這裏 $\lambda_1,\ldots,\lambda_n$ 由 $A$ 唯一確定, 至多相差一個置換。 用二次型的語言, 上述結果相當於給出了實二次型的所謂的規範型, 這一結果是解析幾何中討論二次曲線與二次曲面的歐幾里得分類的代數基礎。 注意到, 因為一個矩陣為正交矩陣當且僅當 $P^{-1}=P'$, 因此上述結果又可以表為下述等價形式: 基本結果6 設 $A$ 為實對稱矩陣, 則 $A$ 實正交相似於一個對角陣 $[\lambda_1,\ldots,\lambda_n]$, 這裏 $\lambda_1,\ldots,\lambda_n$ 由 $A$ 唯一確定, 至多相差一個置換。 基本結果6即關於實對稱矩陣的譜定理, 這是線性代數中最重要的一個定理。同樣的, 對實反對稱矩陣有一個類似的譜定理, 我們敘述如下: 基本結果7 設 $A$ 為實反對稱矩陣, 則 $A$ 實正交相似於一個下述形式的准對角矩陣 $$\mu_1J_2\oplus\cdots\oplus\mu_kJ_2\oplus 0,$$ 這裏 $\mu_1,\ldots,\mu_k$ 由 $A$ 唯一確定, 至多相差一個置換。 同樣的, 我們可以將基本結果7用正交相合的語言表述 (只需在基本結果7中的相似替換為相合), 從略。 如果我們考慮的不是實歐幾里得空間而是複的歐幾里得空間 (即酉空間), 則考慮複矩陣在酉相似與酉相合下的標準型是自然的。 事實上, 關於酉相似, 我們有下述極為重要的結果 (正規矩陣的譜定理): 基本結果8 設 $A$ 是正規矩陣, 則 $A$ 酉相似於一個對角陣 $[\lambda_1,\ldots,\lambda_n]$, 這裏 $\lambda_1,\ldots,\lambda_n$ 由 $A$ 唯一確定, 至多相差一個置換。
回憶起, 一個方陣 $A$ 稱為正規的, 如果 $A$ 與其共軛轉置 $\overline{A}'$ 可交換。
特別的, Hermite 矩陣 ($\overline{A}'=A$) 與酉矩陣 ($\overline{A}'=A^{-1}$) 都是正規矩陣,
因此基本結果8事實上包含了 Hermite 矩陣與酉矩陣的譜定理作為特例。
注意, 斜 Hermite 矩陣 ($\overline{A}'=-A$) 與 Hermite 矩陣之間僅僅相差一個虛數單位因子 $i$,
因此我們只需考慮 Hermite 矩陣。
Hermite 矩陣的譜定理在量子力學中具有基本的重要性。13
13
這在量子力學發展初期給人的印象是極為深刻的,
正如量子理論的偉大先驅 N. Bohr
在1925年的題為原子理論和力學的演講 (見 Hermite 矩陣與酉矩陣事實上與複數域 $\mathbb{C}$ 的共軛自同構密切關聯。 事實上, 對於一個複矩陣 $A$, 我們可以有兩種方式14 14 這個觀點從射影幾何學的角度來看是自然的, 廣義的射影變換實質上同時包含線性變換與共軛線性變換。 將它視為作為線性空間上的幾何變換 (或二元函數): 一種是視為線性變換 (或雙線性型), 一種是視為共軛線性變換 (或線性-共軛線性型)。 在後一種觀點下, 矩陣 $A$ 所代表的幾何變換與二元函數分別是 $x\to A\overline{x}$ 與 $g_A(x,y)=x'A\overline{y}$; 特別的, Hermite 矩陣對應著 Hermite 型。 因此, 對於一個複矩陣, 除了相似與相合兩類變換以外, 還有可以稱之為 共軛相似與共軛相合的兩類變換:$ A\to P^{-1}A\overline{P}$ 與 $A\to P'A\overline{P}$。 對於共軛相合變換, 如果僅限制於考慮 Hermite 矩陣, 則我們有 一個類似 (於實對稱矩陣) 的慣性定理: 基本結果9 設 $A$ 為 Hermite 矩陣, 則 $A$ 共軛相合於對角陣$[\underbrace{1,\ldots,1}_p,\underbrace{-1,\ldots,-1}_q,0,\ldots,0]$, 這裏 $p,q$ 由 $A$ 唯一確定。
關於複矩陣在共軛相似變換下的標準型的結果, 在通常的線性代數教科書甚至矩陣論的專著中都交代得很少,
但相關的結果對於幾何學的研究非常有用 (例如, 見
有必要指出的是, 矩陣的相似(similarity)與相合(congruence)概念是 Frobenius 首次提出的, 而且是標準的。
共軛相似在許寶騄那裏稱為複相似 (而 Y. P. Hong 稱之為餘相似(consimilar)), 我們堅持用共軛相似這個稱謂。
共軛相合在華羅庚那裏 ( 最後, 我們還要介紹一個在矩陣論的發展過程中起著重要作用的關鍵性結果。 該結果屬於 Frobenius, 他當時利用這一個結果解決了歷史上著名的相合變換問題 (congruent transformation problem)。 下面我們對這一問題做簡要的介紹。 我們知道, 事實上, 對於一般的矩陣 (不必是方陣), 還有一類更簡單的變換, 即相抵 (Frobenius 稱之為等價) 變換: $A\to PAQ$, 其中 $P,Q$ 可逆。 對此, 我們也有相當的標準型結果 (這裏我們只考慮方陣)。 基本結果10 設 $A$ 是一個複 (或實) 矩陣, 則 $A$ 相抵於一個對角陣 $[\underbrace{1,\ldots,1}_r,0,\ldots,0]$, 這裏 $r$ 由 $A$ 唯一確定。 事實上, 結果中的 $r$ 是矩陣 $A$ 的秩。因此, 這一結果相當於說, 秩是矩陣在相抵變換下的完全不變量。 另一方面, 根據基本結果2與3, 對於複的對稱 (或反對稱) 矩陣, 秩也是在相合變換下的完全不變量。 因此, 我們立即可以得出這樣的結論: 兩個複對稱 (或反對稱) 矩陣相抵當且僅當它們相合。 注意到, 相合的概念比相抵強, 因此必要性是平凡的。 而 Frobenius 在 1896 年提出的相合變換問題就是, 要直接論證充分性。 即要從兩個複對稱矩陣相抵推出它們相合, 這就是相合變換問題這一名稱的由來。 Frobenius 以下述結果 (這一結果本質上不屬於矩陣的標準型結果, 以示區別, 我們稱之為基本引理) 為基礎對這一問題給出了一個漂亮的解答。 基本引理1 設 $A$ 是一個複方陣, 且 $\det Aeq0$。 設 $A$ 的極小多項式的次數為 $m$, 則存在一個 $m-1$ 次的多項式 $\chi(z)$, 使得 $[\chi(A)]^2=A$。 Frobenius 對上述結果的證明建立在一個關於多項式的結果上, 這個結果值得單獨提出來, 因為該結果 (以及上述基本引理1) 的一個實版本後來為華羅庚得到 (見 § 3.2 引理1與 § 3.5 引理 4 以及 § 3.6 引理5)。 基本引理2 設 $\psi(z)$ 是一個 $m$ 次首一複係數多項式且 $\psi(0)eq0$, 則存在一個 $m-1$ 次首一多項式 $\chi(z)$ 使得 $\chi(z)^2-z$ 被 $\psi(z)$ 整除。
關於這兩個基本引理的證明以及對相合變換問題的應用, 我們
提請有興趣的讀者參考 正如 Hawkins 所指出的, Frobenius 的相合變換問題源於 Weierstrass 與 L. Kronecker (1823$\sim$1891) 對於矩陣對的標準型的研究。例如, Weierstrass 研究了矩陣對 $(A_1,A_2)$ 在相抵變換 $A_1\to PA_1Q,\,A_2\to PA_2Q$ (其中 $P,Q$ 為可逆矩陣) 下的標準型。 雖然這個問題也具有基本的重要性, 但是我們就此打住不再展開。
對於矩陣對的標準型理論的歷史與現狀, 我們推薦
P. Lancaster 與 L. Rodman 最近合寫的兩篇文章 3. 華羅庚的標準型工作之前我們已經介紹了關於標準型的一些經典結果, 這裏我們將介紹華羅庚本人在這方面的一些貢獻。
前面所述的經典工作理所當然地被 Turnbull-Aitken, MacDuffee 等
作者收入到 1930 年代出版的矩陣論專著 我們有了一批群:正交群、辛群、酉群; 有了一批被分類的對象:對稱方陣、 反稱方陣、Hermite 方陣、正交方陣、辛方陣、酉方陣。 因此出現了一系列的問題, 在某一個特定的群下, 把每種特定的方陣分類。 例如, 對稱方陣的正交分類、辛分類、酉分類等。 如果再加上 "數的範圍", 就出現了種種問題。關於這些問題的專門研究, 我不在此一一列舉了。 事實上, 本節的主要內容就是對華羅庚的這段話的內容的一個充分發揮。 華羅庚在這裏所謂的分類, 其實與標準型 或典範型 (canonical form 或 normal form)同義。 3.1. 複對稱矩陣與反對稱矩陣在酉相合下的標準型
在 1944 年發表的第一篇關於多元複變函數的論文 定理1 設 $Z$ 是一個 $n$ 階可逆複對稱矩陣, 則存在酉矩陣 $U$ 使得 $$U'ZU=[\mu_1,\ldots,\mu_n],$$ 這裏 $\mu_1,\ldots,\mu_n$ 是矩陣 $Z\overline{Z}$ 的特徵值的正平方根。 定理2 設 $Z$ 是一個 $n$ 階可逆複反對稱矩陣, 則存在酉矩陣 $U$ 使得 $$U'ZU=\mu_1J_2\oplus\cdots\oplus\mu_kJ_2,$$ 其中 $\mu_1,\ldots,\mu_k$ 為 $-Z\overline{Z}$ 的特徵值的正平方根。
事實上, 定理1是所謂的 Takagi 分解, 這個結果最早由日本數學家 T. Takagi (高木貞治, 1875$\sim$1960)
在 1924 年發現, 之後又相繼被
N. Jacobson (1910$\sim$1999), Siegel, 華羅庚, I. Schur (1875$\sim$1941)
等重新發現, 關於其歷史可以
參見
我們只證明定理1, 定理2類似可證 (一個略微不同的幾何證明可見(pp.117--119) 定理1的證明 令 $W=[\mu_1,\ldots,\mu_n]$。 因為 $Z\overline{Z}$ 為 Hermite 矩陣, 所以存在酉矩陣 $U_1$ 使得 $U_1Z\overline{Z}\overline{U_1'}=W^2$。 於是矩陣 $U_1ZU_1'=F$ 是對稱矩陣, 而且 $F\overline{F}=W^2$。 設 $F_1,F_2$ 分別是矩陣 $F=F_1+iF_2$ 的實部與虛部。因為 $W$ 是實的, 所以我們 得到 $F_1F_2=F_2F_1$; 即這兩個實對稱矩陣 $F_1$ 與 $F_2$ 是可交換的。 這就證明了存在一個實正交矩陣 $D$ 使得 $D'F_1D$ 與 $D'F_2D$ 同時為對角陣。 因此 $D'FD=R$ 也為對角陣 $[r_1,\ldots,r_n]$, 而且 $R\overline{R}=D'W^2D$。 因此數 $r_k\overline{r_k}(k=1,\ldots,n)$ 是 $\mu_1^2,\ldots,\mu_n^2$ 的一個置換, 我們顯然可以假定 $r_k\overline{r_k}=\mu_k^2$。 令 $U_2=[\sqrt{\frac{r_1}{\mu_1}},\ldots,\sqrt{\frac{r_n}{\mu_n}}]$, 則 $U_2$ 為酉矩陣而且 $U_2'WU_2=R$。 令 $U=\overline{U_2}D'U_1$, 則有 $UZU'=\overline{U_2}D'U_1ZU_1'D\overline{U_2}'= \overline{U_2}D'FD\overline{U_2}'=\overline{U_2}R\overline{U_2}'=W$; 證畢。
注記
華羅庚在 3.2. Hermite 矩陣對的相聯標準型與 Hermite 矩陣在辛相聯下的標準型
在
華羅庚通過解決另一個標準型問題 --- 即一對 Hermite 矩陣在相合下的標準型 --- 而求出 Hermite 矩陣在辛相聯下的標準型。
Hermite 矩陣對 $G_1,G_2$ 與 $H_1,H_2$ 稱為相聯的,
如果存在一個可逆矩陣 $P$, 使得 $PG_1\overline{P}'=H_1,PG_2\overline{P}'=H_2$。
關於 Hermite 矩陣對的分類問題的討論在此前確實有很多工作。
例如, 華羅庚在 引理1 設 $q(x)$ 是一個實係數首一多項式, 沒有小於等於零的根, 則存在一個實係數多項式 $\chi(x)$ 使得 $\chi(x)^2-x$ 被 $q(x)$ 整除。
由於這個引理本身的重要性, 我們在此錄出華羅庚的證明如下。18
18
正如
H. Rademacher (1892$\sim$1969) 在《數學評論》上指出的 (見 MR0011134 (6,124c)),
該文含有許多討厭的印刷錯誤 (The paper contains quite a number of bothersome misprints), 此處我們已經修正。
需要指出的是, 這裏所討論的華羅庚的文章基本上都是在抗日戰爭時期的西南聯大完成的,
當時條件艱苦, 華羅庚在飛機轟炸中甚至遭遇了死裏逃生 (見 證明 設 $$q(x)=\prod_{i=1}^s(x-a_i)^{l_i}\prod_{j=1}^t\big((x-\alpha_j)(x-\overline{\alpha_j})\big)^{m_j},$$ 其中 $a_i\gt 0$, $\alpha_j$ 是虛部不等於 $0$ 的複數。 第一步 首先證明引理對多項式 $$q(x)=(x-a)^l$$ 成立。 事實上, 引理對 $l=1$ 成立, 因為此時 $\chi(x)=\sqrt{a}$ 是一個解。 假定對 $l-1\geq0$ 我們有一個實係數多項式 $\chi_{l-1}(x)$ 使得 $$\chi_{l-1}^2(x)-x=(x-a)^{l-1}\lambda(x),$$ 這裏 $\lambda(x)$ 是一個實係數多項式。顯然 $\chi_{l-1}(a)eq0$。 於是 $$\chi_l(x)=\chi_{l-1}(x)-\frac{1}{2}\frac{\lambda(a)}{\chi_{l-1}(a)}(x-a)^{l-1}$$ 滿足我們的要求, 因為 \begin{align*} \chi_l^2(x)-x&\equiv\chi_{l-1}^2(x)-x-\frac{\lambda(a)}{\chi_{l-1}(a)}\chi_{l-1}(x)(x-a)^{l-1}\\ &\equiv\Big(\lambda(x)-\frac{\lambda(a)}{\chi_{l-1}(a)}\chi_{l-1}(x)\Big)(x-a)^{l-1}\\ &\equiv0\pmod{(x-a)^l}. \end{align*} 第二步 證明引理對 $$q(x)=\big((x-\alpha)(x-\overline{\alpha})\big)^l$$ 成立。事實上, 對 $l=1$, 多項式 $$\chi(x)=\frac{1}{\sqrt{2|\alpha|+\alpha+\overline{\alpha}}}(x+|\alpha|)$$ 滿足條件, 因為 $2|\alpha|+\alpha+\overline{\alpha}\gt 0$ 而且 \begin{align*} \chi^2(x)-x&=\frac{1}{2|\alpha|+\alpha+\overline{\alpha}}(x^2+2|\alpha|x+|\alpha|^2)-x\\ &=\frac{1}{2|\alpha|+\alpha+\overline{\alpha}}(x-\alpha)(x-\overline{\alpha})\\ &\equiv0\pmod{(x-\alpha)(x-\overline{\alpha})}. \end{align*} 假定對 $l-1\geq0$ 我們有一個實係數多項式 $\chi_{l-1}(x)$ 使得 $$\chi_{l-1}^2(x)-x=\big((x-\alpha)(x-\overline{\alpha})\big)^{l-1}\lambda(x),$$ 這裏 $\lambda(x)$ 是一個實係數多項式。 則可以直接驗證 $$\chi_l(x)=\chi_{l-1}(x)+\big((x-\alpha)(x-\overline{\alpha})\big)^{l-1}(bx+c)^l$$ 滿足我們的要求, 這裏實數 $b,c$ 滿足 ($b,c$ 的存在性很容易看出, 因為 $\alpha$ 不是實數且 $\chi_{l-1}(\alpha)eq0$。) $$\lambda(\alpha)+2(b\alpha+c)\chi_{l-1}(\alpha)=0.$$ 第三步 設 $q_1(x)$ 與 $q_2(x)$ 是兩個互素的實係數多項式, 令實係數多項式 $\chi_1(x)$ 與 $\chi_2(x)$ 分別滿足 $$\chi_1^2(x)-x\equiv 0\pmod{q_1(x)}\qquad\text{與}\qquad\chi_2^2(x)-x\equiv 0\pmod{q_2(x)}.$$ 眾所周知, 存在兩個實係數多項式 $h_1(x)$ 與 $h_2(x)$ 使得 $$h_1(x)q_1(x)+h_2(x)q_2(x)=1.$$ 於是, 令 $$\chi(x)=\chi_1(x)h_2(x)q_2(x)+\chi_2(x)h_1(x)q_1(x)$$ 則有 $$\chi^2(x)-x\equiv 0\pmod{q(x)}.$$ 反覆應用這一過程, 則我們得到了引理。證畢。
華羅庚將這一引理用於 Hermite 矩陣的特徵多項式 (注意到
它是實係數的), 由此最終得到了 Hermite 矩陣對的相聯標準型結果,
即 定理3 設 $G_1,G_2$ 是兩個 $n$ 階 Hermite 矩陣, 其中 $G_2$ 可逆。 則 $G_2^{-1}G_1$ 的初等因子具有形式 $(\lambda-\lambda_1)^{n_1},\ldots,(\lambda-\lambda_\alpha)^{n_\alpha}, (\lambda-\lambda_{\alpha+1})^{n_{\alpha+1}},(\lambda-\overline{\lambda_{\alpha+1}})^{n_{\alpha+1}}, \ldots,(\lambda-\lambda_{\beta})^{n_{\beta}},(\lambda-\overline{\lambda_{\beta}})^{n_{\beta}}$, 其中當 $q=1,\ldots,\alpha$ 時, $\lambda_q$ 為實數, 而當 $q=\alpha+1,\ldots,\beta$ 時, $\lambda_q$ 不是實數。 而且存在一個 $n$ 階可逆矩陣 $T$ 使得 $TG_1\overline{T}'$ 與 $TG_2\overline{T}'$ 分別具有形式 \begin{align} TG_1\overline{T}'&={\varepsilon}_1K_1\oplus\cdots\oplus{\varepsilon}_{\alpha}K_{\alpha} \oplus \begin{pmatrix} 0&K_{\alpha+1}\\ \overline{K_{\alpha+1}}&0 \end{pmatrix}\oplus\cdots\oplus\begin{pmatrix} 0&K_{\beta}\\ \overline{K_{\beta}}&0 \end{pmatrix},\label{1}\\ TG_2\overline{T}'&={\varepsilon}_1P_1\oplus\cdots\oplus{\varepsilon}_{\alpha}P_{\alpha} \oplus\begin{pmatrix} 0&P_{\alpha+1}\\ P_{\alpha+1}&0 \end{pmatrix}\oplus\cdots\oplus\begin{pmatrix} 0&P_{\beta}\\ P_{\beta}&0 \end{pmatrix},\label{2} \end{align} 其中 $\varepsilon_q=\pm1(q=1,\ldots,\alpha)$, 而 $$K_q=\begin{pmatrix} 0&&&0& \lambda_q \\ 0&&& \lambda_q &1\\ 0&&&1&0\\ 0 & \lambda_q & 1 &&\vdots\\ \lambda_q&1&0&\cdots&0 \end{pmatrix},\qquad P_q=\begin{pmatrix} 0 &&&0& 1 \\ 0&&& 1 &0\\ 0&&&0&0\\ 0& 1 & 0 &&\vdots\\ 1&0&0& \cdots &0 \end{pmatrix} \quad \in M(n_q, \mathbb{C}). $$ 表達式 \eqref{1}\eqref{2} 由 $G_1$ 與 $G_2$ 唯一決定, 任意兩個這樣的表達式 僅僅相差 \eqref{1} 與 \eqref{2} 中的對角塊的一個同時置換。
此外, 作者在 通過一種迂回的巧妙方式應用定理3, 華羅庚關於 Hermite 矩陣 在辛相聯下的標準型結果, 此處不再贅述。 需要補充的是, 華羅庚最後指出了, 定理3可直接應用於解決 Hermite 矩陣 $H$ 在變換 $H\to P'H\overline{P}$ 下的標準型, 其中 $P'J\overline{P}=J$。 這是因為, 存在可逆矩陣 $P$ 使得 $P'J\overline{P}=J$ 且 $P'H_1\overline{P}=H_2$ 當且僅當 存在可逆矩陣 $P$ 使得 $P'iJ\overline{P}=iJ$ 且 $P'H_1\overline{P}=H_2$, 即 Hermite 矩陣對 $(H_1,iJ)$ 與 $(H_2,iJ)$ 相聯。
注記華羅庚 3.3. Hermite 矩陣在正交相聯下的標準型
在 最後, 我們要特別指出, 華羅庚將他的一般結果應用於確定正交反對合在正交關聯下的標準型。 一個方陣 $A$ 稱為反對合, 如果滿足 $A\overline{A}=\pm I$, 進一步, 取正號的稱為第一類反對合, 取負號的稱為第二類反對合。 如果 $A$ 是第一類正交反對合, 則從條件 $AA'=I$ (正交) 與 $A\overline{A}=I$ (第一類反對合) 立即推出 $A$ 是 Hermite 矩陣, 因此可以對 $A$ 利用 Hermite 矩陣在正交關聯變換下的標準型結果。 同理, 若 $A$ 是第二類正交反對合, 則 $iA$ 是 Hermite 矩陣。這兩個小結果也許值得一提: 定理4 (i) 設 $A\in M(n,\mathbb{C})$ 是第一類正交反對合, 則存在正交矩陣 $P$ 使得 $$P'A\overline{P}=P^{-1}A\overline{P}=[\underbrace{1,\ldots,1}_p,\underbrace{-1,\ldots,-1}_q],$$ 其中 $p,q$ 由 $A$ 唯一確定。 (ii) 設 $A\in M(n,\mathbb{C})$ 是第二類正交反對合, 則 $n$ 是偶數, 且存在正交矩陣 $P$ 使得 $$P'A\overline{P}=P^{-1}A\overline{P}=\begin{pmatrix} 0& I \\ -I&0 \end{pmatrix}.$$
注記
我們之所以不在此敘述華羅庚關於 Hermite 矩陣的正交相聯與辛相聯的標準型, 除了篇幅的考慮以外,
還有一個重要的原因, 就是後來許寶騄
許寶騄在1957年發表的一篇長文
1958年, 嚴志達、陳雅深
從代數的觀點來說, 這樣的問題屬於所謂二次型偶理論的一頁,
關於各種形式的二次型偶問題的討論, 由來已早。
但是由於近代群論方面的發展, 尤其是所謂對稱黎曼空間的理論,
使得這些問題重新得到新的幾何學的意義。華羅庚先生在他的一系列關於"矩陣幾何"的重要工作中也曾對這樣的問題有過很多的貢獻。
特別應該提出的是他的關於准酉空間對稱變換分類的研究
(按:即 3.4. 辛對合與辛反對合的標準型
在 定理5 (i) 設 $A$ 是第一類辛對合, 則辛相似於 $$\begin{pmatrix} H &0\\ 0& H \end{pmatrix},$$ 其中 $H=[\underbrace{1,\ldots,1}_p,\underbrace{-1,\ldots,-1}_q]$, 這裏 $p,q$ 由 $A$ 唯一確定。 (ii) 任一第二類辛對合一定辛相似於 $$\begin{pmatrix} 0& I \\ -I&0 \end{pmatrix}.$$
華羅庚在 定理6 (i) 設 $A$ 是第一類辛反對合, 則存在辛矩陣 $P$ 使得 $$P^{-1}A\overline{P}=\begin{pmatrix} 0& iI \\ iI &0 \end{pmatrix}.$$ (ii) 設 $A$ 是第二類辛反對合, 則存在辛矩陣 $P$ 使得 $$P^{-1}A\overline{P}=\begin{pmatrix} 0& iH \\ -iH&0 \end{pmatrix},$$ 其中 $H=[\underbrace{1,\ldots,1}_p,\underbrace{-1,\ldots,-1}_q]$, 這裏 $p,q$ 由 $A$ 唯一確定。 華羅庚將定理6的證明歸結為他早先的文章中關於 Hermite 矩陣的辛相聯標準型的一個簡單應用。 這裏基本的觀察有兩點:第一, $A$ 是第一類 (第二類) 辛反對合當且僅當 $iJA$ ($JA$) 是 Hermite 矩陣; 第二, $A$ 與 $B$ 辛共軛相似當且僅當 $JA$ 與 $JB$ 辛關聯。 因此, 可以先通過應用 Hermite 矩陣的辛相聯標準型得出 $iJA$ ($JA$) 的標準型, 再由此得到 $A$ 在辛共軛相似之下的標準型。
注記1
華羅庚後來在關於典型群的文章
注記2
Dieudonné 所應用的幾何方法的優越性在此值得重提。也許, 用 E. Artin 的一句話來評論 Dieudonné 與華羅庚的差異所在是合適的:
我的經驗是, 一個用矩陣進行的證明,
如果你拋開矩陣的話往往可以使這個證明縮短一半。至少在此處, 對於考慮對合這個具有幾何內涵的對象來說,
用幾何的方法更自然。事實上, 在矩陣的標準型工作方面,
幾何方法是極為有力的方法, 這一方法首先由 A. I. Mal'cev (1909$\sim$1967) 在他寫的教材
注記3
華羅庚在 1945$\sim$1947年以矩陣幾何為題發表了三篇文章, 其中這裏所討論的文章事實上是幾何風味最濃的一篇。
華羅庚在文章中提出的對辛對合的研究引發了兩個方面的幾何研究。
一方面, 華羅庚曾指導孫本旺研究所有辛對合構成的流形的幾何, 孫本旺 3.5. 一對反交換的辛對合與正交對合的標準型
及其應用, 兩兩反交換的辛對合集的標準型及其應用
華羅庚在文章 定理7 設 $A_1,A_2\in\,Sp(2m,\mathbb{C})$ 滿足 $$A_1^2=A_2^2=-I,\qquad A_1A_2=-A_2A_1,$$ 則存在 $P\in\,Sp(2m,\mathbb{C})$ 使得 $$ \qquad PA_1P^{-1}=\begin{pmatrix} iI &0\\ 0&-iI \end{pmatrix}\qquad \mbox{且}\qquad PA_2P^{-1}=\begin{pmatrix} 0& I \\ -I&0 \end{pmatrix}. $$ 定理8 設 $B_1,B_2\in O(n,\mathbb{C})$ 滿足 $$B_1^2=B_2^2=I,\qquad B_1B_2=-B_2B_1,$$ 則 $n=2m$ 且存在 $P\in\,O(n,\mathbb{C})$ 使得 $$ PB_1P^{-1}=\begin{pmatrix} I &0\\ 0&-I \end{pmatrix}\qquad \mbox{且}\qquad PB_2P^{-1}=\begin{pmatrix} 0& I \\ I &0 \end{pmatrix}. $$ 華羅庚是在求解一個有趣的矩陣問題的過程中獲得這些標準型結果的, 這個問題是: 對任意給定的正整數 $n$, 求 $r$ 的最大值, 使得存在 $r$ 個 $n$ 階辛矩陣 $A_1,\ldots,A_r$ 滿足下述關係: $$A_i^2=-I,\qquad A_iA_j=-A_jA_i \qquad(i=1,\ldots,r).$$
因為計算上的疏忽,
華羅庚未能徹底解決上述問題。21
21
這一點首先由黃用諏 (1913$\sim$2004) 在 定理9 設 $A_1,A_2\in O(n,\mathbb{C})$ 滿足 $$A_1^2=A_2^2=-I,\qquad A_1A_2=-A_2A_1,$$ 則 $n=4l$ 且存在 $P\in\,O(n,\mathbb{C})$ 使得 $$ PA_1P^{-1}=\begin{pmatrix} 0& I \\ -I&0 \end{pmatrix}\qquad \mbox{且}\qquad PA_2P^{-1}=\begin{pmatrix} J &0\\ 0&-J \end{pmatrix}. $$ 定理10設 $B_1,B_2\in Sp(2m,\mathbb{C})$ 滿足 $$B_1^2=B_2^2=I,\qquad B_1B_2=-B_2B_1,$$ 則 $m=2l$ 且存在 $P\in\,Sp(2m,\mathbb{C})$ 使得 $$ PB_1P^{-1}=\begin{pmatrix} 0& iJ \\ iJ &0 \end{pmatrix}\qquad \mbox{且}\qquad PB_2P^{-1}=\begin{pmatrix} 0&-J\\ J &0 \end{pmatrix}. $$
一旦有了定理7$-$10, 就不難得到華羅庚論文 定理11 令 $n=2^q n_0$, 這裏 $n_0$ 是奇數。 設 $P(n),R(n)$ 分別表示使得方程 \begin{equation} A_i^2=-I,\qquad A_iA_j=-A_jA_i, \qquad(i=1,\ldots,r)\label{3} \end{equation} 在 $Sp(n,\mathbb{C})$ 與 $O(n,\mathbb{C)}$ 中有解的最大整數 $r$, 設 $Q(n),S(n)$ 分別表示使得方程 \begin{equation} B_i^2=I,\qquad B_iB_j=-B_jB_i, \qquad(i=1,\ldots,r)\label{4} \end{equation} 在 $Sp(n,\mathbb{C})$ 與 $O(n,\mathbb{C})$ 中有解的最大整數 $r$。 則有 $$ P(n)=\left\{\begin{array}{ll} 2q-1&\quad \textrm{若 $q\equiv0\pmod4$}\\ 2q+1&\quad\textrm{若 $q\equiv1\pmod4$}\\ 2q&\quad\textrm{若 $q\equiv2\pmod4$}\\ 2q-1&\quad\textrm{若 $q\equiv3\pmod4$} \end{array}\right.\qquad Q(n)=\left\{\begin{array}{ll} 2q-1&\quad\textrm{若 $q\equiv0\pmod4$}\\ 2q-1&\quad\textrm{若 $q\equiv1\pmod4$}\\ 2q+1&\quad\textrm{若 $q\equiv2\pmod4$}\\ 2q&\quad\textrm{若 $q\equiv3\pmod4$} \end{array}\right. $$ $$ R(n)=\left\{\begin{array}{ll} 2q&\quad\textrm{若 $q\equiv0\pmod4$}\\ 2q-1&\quad\textrm{若 $q\equiv1\pmod4$}\\ 2q-1&\quad\textrm{若 $q\equiv2\pmod4$}\\ 2q+1&\quad\textrm{若 $q\equiv3\pmod4$} \end{array}\right. \qquad S(n)=\left\{\begin{array}{ll} 2q+1&\quad\textrm{若 $q\equiv0\pmod4$}\\ 2q&\quad\textrm{若 $q\equiv1\pmod4$}\\ 2q-1&\quad\textrm{若 $q\equiv2\pmod4$}\\ 2q-1&\quad\textrm{若 $q\equiv3\pmod4$} \end{array}\right. $$
事實上, 定理11是下述兩個引理 (它們一起補正了華羅庚
引理2 在定理11的條件下, 成立 \begin{equation} P(2n)=S(n)+2,\label{5} \end{equation} \begin{equation} S(2n)=R(n)+2,\label{6} \end{equation} \begin{equation} R(2n)=Q(n)+2,\label{7} \end{equation} \begin{equation} Q(2n)=P(n)+2.\label{8} \end{equation} 引理3 在定理 11 的條件下, 對於任意的奇數 $n_0$, 我們有以下初始值: $$ S(n_0)=1,\quad R(n_0)=0,\quad R(2n_0)=1,\quad Q(2n_0)=1. $$ 由引理2與引理3很容易推導出定理11中 $P(n),Q(n),R(n),S(n)$ 的表達式。而引理2與引理3的證明很容易從 定理5 (及其正交版本) 與定理 7$-$10 得到。 注意到, 由引理2立即推出, $P(n),Q(n),R(n),S(n)$ 皆滿足以下週期性關係: \begin{equation} \lambda(16n)=\lambda(n)+8.\label{9} \end{equation}
特別要指出的是, 華羅庚在
注記1
華羅庚原本有可能以一種最快的方式獲得定理11中 $P(n)$ (與 $S(n)$) 的表達式, 如果他能瞭解到,
$R(n)$ 的表達式早在 1920 年代就為 A. Hurwitz (1859$\sim$1919) 得到的話。
Hurwitz 在曾考慮下述問題:
求正整數 $r$ 與 $n$ 所滿足的條件, 使得 $O(n,\mathbb{C})$ 中存在 $r$ 個矩陣 $A_1,\ldots,A_r$ 滿足 \eqref{3}。
1922年, J. Radon (1887$\sim$1956)對實矩陣考慮了對應的問題, 得到的結果與 Hurwitz 關於複矩陣的結果相同,
不過他將其結果表述成一種更加簡明的方式。
Hurwitz 與 Radon 的這一貢獻曾在 MacDuffee 的矩陣論專著
J. Radon 確定了最大數 $u(n)$ 使得存在 $u$ 個 $n$ 階實矩陣 $A_1,\ldots,A_u$ 滿足: 對任意的滿足 $x_1^2+\cdots+x_u^2=1$ 的實數 $x_1,\ldots,x_u$ 都有, $x_1A_1+\cdots+x_u A_u$ 為正交矩陣。如果 $n=2^{4\alpha+\beta}n'$, $n'$ 為奇數, $\beta=0,1,2,3$, 那麼這個值是 $u=2^\beta+8\alpha$。} 事實上, 按照 $R(n)$ 與 $u(n)$ 的定義, 不難看出, $R(n)=u(n)-1$。 因此, 借助於 Hurwitz-Radon 的上述定理 (對複矩陣), 立即就可以確定出 $R(n)=2^\beta+8\alpha-1$ (這與定理11中關於 $R(n)$ 的表達式是一致的), 從而進一步確定出 $S(n)$ 與 $P(n)$。 但是, 如果華羅庚真的這樣處理, 我們也許就看不到引理2這樣的美妙結果了。事實上, 在這裏, 結果本身 (定理11) 反倒不及它所依賴的基本事實 (引理2) 重要。
定理11包含了複數域上的 Hurwitz-Radon 定理 (即 $R(n)$ 的表達式),
而這一結果在代數、幾何、分析、拓撲各領域皆有廣泛的應用。
雖然 Hurwiz-Radon 定理在 Hurwitz 與 Radon 之後有了許多證明, 但是利用華羅庚的思想的上述證明是最能夠與
Hurwitz 與 Radon 的原始證明相媲美的一個 (關於 Radon 證明的可以一個中文介紹, 可以參見江上鷗
注記2
定理11、引理2與引理3還有一個"酉化"版本。
所謂酉化, 事實上就是酉限制 (在拓撲上相當於緊化),
例如, 複正交群 $O(n,\mathbb{C})$ 的酉化就是 $O(n,\mathbb{C})\cap U(n)=O(n,\mathbb{R})$ 即實正交群, 而複辛群 $Sp(2n,\mathbb{C})$ 的酉化則是
$Sp(2n,\mathbb{C})\cap U(n)=USp(2n)$ 即酉辛群 (現今流行的記號是 $Sp(n)$, 而且稱作緊致辛群)。
酉限制是一個強有力的技巧, 這一技巧為 Weyl 首創, 並且命名為"酉技巧",
見
注記3
定理 11 中所研究的問題可以對任意的典型群 (線性群、正交群、辛群與酉群)
考慮。特別的, 華羅庚最初關心的那一個問題 (對應于辛群的情形)
可以放在任意的特徵不等於2的域上研究, 最近筆者 3.6. 辛矩陣的辛相似
華羅庚關於辛矩陣的標準型工作後來經整理以中文發表於1962年《中山大學學報》, 見 定理12 任意複辛方陣一定辛相似於以下形式的辛方陣的直和: (I) $$\begin{pmatrix} J_r(\lambda)'&0\\ 0&J_r(\lambda)^{-1} \end{pmatrix},\qquad \text{($\lambda\neq\pm1$, 或者 $\lambda=\pm1$ 但 $r$ 是奇數)}$$ (II) $$\begin{pmatrix} J_r(\lambda)'& SJ_r(\lambda)^{-1} \\ 0&J_r(\lambda)^{-1} \end{pmatrix},\qquad \text{($\lambda=\pm1$, $r$ 為任意整數, $S=[1,0,\ldots,0]$)}$$
並且, 每一個支量不可分解為兩個低階辛矩陣的直和。23
23
事實上, 根據
這裏特別要交代的是, 兩個辛矩陣的直和如下定義 (見 華羅庚還進一步得到了實辛矩陣在實辛相似下的標準型。 但這一結果曾被 Williamson 在 1937 年的文章 {normal forms for canonical matrices} 中得到。也許, 華羅庚已經通過 Weyl 瞭解到這一事實。
為了克服涉及到的困難, 華羅庚需要證明某些實方陣有實的平方根, 這就導致了
下述 ( 引理4 任一無零根及負特徵根的實方陣有實的平方根。 證明 對給定方陣 $A$ 的特徵多項式 $q(x)$ 應用引理1, 則存在實係數多項式 $\chi(x)$ 使得 $$\chi^2(x)-x\equiv 0\pmod{q(x)},$$ 即對某實係數多項式 $\lambda(x)$ 有, $\chi^2(x)-x=q(x)\lambda(x)$, 在其中令 $x=A$, 則得到 $\chi^2(A)-A=q(A)\lambda(A)=0$。 令 $B=\chi(A)$, 則立即有 $B^2-A=0$, 即 $B$ 是 $A$ 的平方根。證畢。
基於定理12與引理4, 華羅庚得到了實辛矩陣在實辛相似下的標準型
(
在
注記
相對於 3.7. 由實對陣矩陣與反對稱矩陣構成的矩陣對在相合下的標準型
及其應用
注意到, § 3.1$-$§ 3.3 只考慮了複矩陣, 如果考慮實的情形 (如華羅庚所述, "數的範圍"), 則得到以下課題: 課題1:實對稱矩陣 (或反對稱矩陣) 在正交相合下的標準型。 課題2:實對稱矩陣在辛相合下的標準型。 課題3:實對稱矩陣在正交相合下的標準型。
注意到, 課題1與課題3不是新的, 其結論就是 § 2 中的基本結果6, 7。
因此只有課題2可能是新的。華羅庚
從 Hamilton力學的觀點來看, 最簡單的力學系統其 Hamilton 函數由二次函數給出:
$$H(x,p)=\frac{1}{2}\big(x\quad p\big)\begin{pmatrix}
A& B \\
B' &C
\end{pmatrix}\begin{pmatrix}
x\\
p
\end{pmatrix}$$
而對應的 Hamilton 方程具有以下形式:
$$\dot{y}=Ky,\qquad K=JH$$
其中
$$J=\begin{pmatrix}
0& I \\
-I&0
\end{pmatrix},\qquad H=\begin{pmatrix}
A& B \\
B' &C
\end{pmatrix}.$$
即其對應的 Hamilton 向量場 $K$ 則由一個 Hamilton 矩陣給出, 因而是線性的 (最簡單的!) 向量場。
回憶起, 一個 $2n$ 階實矩陣 $K$ 稱為 Hamilton 矩陣, 如果 $JK$ 是對稱矩陣。27
27
Hamilton
矩陣也稱為線性典則變換(linear canonical transformation)。事實上, 所有的 $2n$ 階 Hamilton 矩陣
構成李群 $Sp(2n,\mathbb{R})$ 的李代數。
注意到, 物理上的典則變換 (canonical transformation)
即數學上的實辛變換。
於是, 將利用典則變換將二次型 Hamilton 系統化簡的問題, 事實上是一個典型的矩陣標準型問題:
求 Hamilton 矩陣在辛相似下的標準型。
Williamson 為看出 Williamson 的這一問題與華羅庚所考慮的實對稱矩陣在辛相合下的標準型的等價性, 只需要注意到:第一, 矩陣 $K$ 為 Hamilton 矩陣當且僅當 $JK$ 為對稱矩陣, 第二, 矩陣 $K_1,K_2$ 辛相似當且僅當 $JK_1,JK_2$ 辛相合。 (用群作用的話來說, 即辛群在 Hamilton 矩陣集上的相似作用與 在對稱矩陣集上的相合作用是等價的。)
第一, 華羅庚強調, 處理實矩陣的標準型問題的關鍵
仍然是前面提到的關於實矩陣的平方根的存在性引理 (引理4),
而且華羅庚在 引理5任一滿秩的、僅有非負特徵根的 實方陣一定有一實的 平方根, 而且它可以表為原方陣的實係數的多項式。
第二, 與 Williamson 一樣,
華羅庚首先解決了另一個更一般的標準型問題:
由一個實對稱矩陣與一個實反對稱矩陣構成的矩陣對的實相合標準型 (
華羅庚還特別指出了後一結果在球幾何與狹義相對論上的應用。此外, 在《從單位圓談起》
注記
華羅庚在 4. 華羅庚與 Williamson在矩陣的標準型方面, 華羅庚應該是很早就通過 Weyl 瞭解到, 他的工作與 Williamson 有不少重複。 因為這裏主要介紹華羅庚的工作, 我們不打算詳細介紹 Williamson 的相關工作, 而只是簡單地來瞭解一下這位與華羅庚有著相同興趣 (矩陣論) 的前輩。
John Williamson (1901$\sim$1949), 蘇格蘭數學家。
1927年, Williamson 在芝加哥大學 Dickson 的指導下獲得博士學位
(而楊武之則在1928年得博士學位, 可以說 Williamson 是華羅庚的師伯)。得學位之後, Williamson
在霍普金斯大學找到了職位, 當時的數學系主任是
F. D. Murnaghan (1873$\sim$1976)。Murnaghan 對數學物理很有興趣,
他在1930年與1931年又聘來與他趣味相投的 A. Wintner (1903$\sim$1958)與 R. E. van Kampen (1908$\sim$1942)。
這些人的工作特別是 Wintner 關於 Hamilton 系統與微分方程的工作,
推動了 Williamson 去研究動力系統中的代數問題,
其中有一些可以歸結為矩陣的標準型問題。
從 1935 年開始,
Williamson 考慮了各種類型的矩陣標準型問題,
在1935$\sim$1940年間,
他平均每年要發表兩篇關於這個主題的論文。
除了早期 (1929$\sim$1934年) 關於 (Gordan 意義下的) 經典不變量
的工作以外, 矩陣標準型工作是他最主要的貢獻。
此外, 他還以 Hadamard 矩陣的 Williamson 構造而著名。28
28
也許,
特別值得一提的還有 Williamson
Williamson 選擇研究矩陣的標準型問題是相當明智的。
一方面, 如前所述, 這些問題有具體的應用背景。
另一方面, Williamson 有這方面的基本訓練, 在入芝加哥大學之前,
他在英國愛丁堡大學主要受到他老師 Turnbull (1885$\sim$1961, Turnbull-Aitken 中的 Turnbull!)
的影響, 事實上他們還曾合作了一些文章。
他在芝加哥大學的導師 Dickson 更是一個長於計算的代數學家, 而且對矩陣論也很看重。
例如, C. C. MacDuffee (1895$\sim$1961),
Dickson 的另一個學生 (1921年得博士學位), 也曾出版過一本矩陣論的專著
在 Williamson 的所有工作中, 最有影響的工作也許正是關於 Hamilton 矩陣與辛矩陣的標準型工作,
即
特別值得一提的是, 出於偏微分方程理論的
需要, L. Hörmander (1931$\sim$2012) 在 1995 年的
文章
這些結果不是新的, 因為 Williamson
如果 Hörmander 知道華羅庚
無論如何, 應該指出, 在矩陣的標準型方面,
雖然華羅庚的工作與 Williamson 有
不少重複, 但是華羅庚採用的方法更優越、更容易理解, 更便於應用。
例如對於實數域的情形, 華羅庚多次強調實矩陣平方根的存在 (引理 4 與引理 5) 之重要性;
再如, 華羅庚力求給出標準型矩陣的顯式表達
(他在 當然, 華羅庚對矩陣標準型研究的最大特點在於, 其研究動機與背景來自於多複變元函數論與矩陣幾何。 例如, 在多元複變函數論的研究中, 華羅庚感興趣的是由 Élie Cartan 在1935年所定義的四類典型域。 從 F. Klein (1849$\sim$1925) 的幾何觀點來看, 一個重要的問題是決定這些典型域上的全純自同構群。 類比于單變量的情況, 這裏首先就會出現一個問題:該全純自同構群的作用是不是可遷的? 換言之, 該空間是不是齊性的 (任意兩點等價)? 注意到, 各類典型域由各種不同類型的矩陣組成, 而且可以觀察出全純自同構群有一個矩陣群作為子群, 所以這就遇到了矩陣的標準型問題。 華羅庚憑藉嫺熟的矩陣技巧, 得到了各類典型域是齊性的結論。 (決定出各類典型域的全純自同構群則由 Siegel、 華羅庚與其他數學家在 1943$\sim$1962 年間陸續完成。) 所以, 現在的研究對象就非常具體了: 一個矩陣群作用在矩陣集 (典型域) 上, 而且這個作用本質上是代數的。 沿著 Klein 的幾何觀點繼續往下走就會遭遇各種各樣的矩陣標準型問題。這就是華羅庚關於矩陣的標準型工作的背景。 小結 華羅庚與 Williamson 的工作有許多重複, 也許他對 Williamson 有一種 "既生瑜, 何生亮"的感慨。可惜的是, 在華羅庚去美國之前, Williamson 已遷居加拿大, 使得 華羅庚未能與這位前輩謀面。更為可惜的是, 在 Williamson 早逝之前, 他在矩陣論方面的獨特造詣還沒有找到薪火傳人。 華羅庚的工作晚於 Williamson, 而且不少工作都沒能及時發表, 雖然 1960 年代用中文發表了一些早期工作, 卻鮮為人知, 以至於一些外國同行重複了華羅庚的部分工作。 在矩陣的標準型工作方面, Williamson 與華羅庚是 二十世紀最有影響、最值得紀念的兩位先驅。 致謝 特別感謝的是, 南開大學數學所龍以明教授向筆者介紹了他們的相關工作。 感謝中科院數學所的陸啟鏗先生接受筆者的電話採訪, 他特別指出, 他從華先生那裡學到的一個技巧是矩陣的「極坐標」, 此外, 在他寫的多複變專著《典型流形與典型域》中還專門有一個關於矩陣論的附錄。 感謝審稿人向筆者提供了關於 Williamson 的諸多信息, 並對初稿提出了諸多指正。 在寫作過程中, 筆者還得到了中國科學技術大學劉會老師與首都師範大學趙潔同學的幫助, 特表感謝。 ---本文作者任教西北農林科技大學理學院--- |