39108 華羅庚關於矩陣標準型的工作介紹

終極密碼

遊戲規則:本遊戲為猜密碼的遊戲。密碼為0到100之間的其中1個整數,電腦會提示密碼的所在範圍,玩家必須在6次之內猜到密碼才能過關。
★ 終極密碼為0到100之間 ★
您共有六次機會

華羅庚的矩陣技巧使得邀請他1946年去普林斯頓高等研究院訪問的 H. Weyl 十分賞識, Weyl 曾說:「華羅庚玩矩陣就如玩數字一樣。」

陸啟鏗, (p. 52)

緣起

華羅庚 (1910$\sim$1985), 江蘇金壇人, 二十世紀中國最有影響力的數學家之一。 華羅庚是自學成才的大數學家, 他的故事曾激勵了一代又一代的學生走上數學研究的道路。 作為一名學者, 他對後人特別是華人的影響是無法估量的。

關於華羅庚的傳奇人生, 他的學生王元曾經寫過一本很好的傳記 , 這本書為我們瞭解華羅庚提供了一盞明燈。 (這本書榮獲首屆"吳大猷科學普及著作獎"金簽獎。) 王元與楊德莊還合寫了另一本書 , 正如標題所表明的, 這本書側重於介紹華羅庚的數學成就。 筆者也正是從這兩本書入手, 逐漸對華先生的數學工作有了粗淺的瞭解。 本文就是筆者這些年來積累下來的、特別想與讀者們分享的一點心得, 也可以說是一個學習報告。

對於華羅庚的數學工作, 已經有了許多介紹, 特別的, 可見華羅庚的論文選集中由他的弟子王元、 萬哲先、 陸啟鏗、 龔昇所寫的專門介紹。 這裏我們主要介紹華羅庚在矩陣論方面的工作。 在華羅庚的所有工作中, 代數方面的工作並不是最有影響的 (根據丘成桐的看法1 1 丘成桐指出: 中國近代數學能超越西方或與之並駕齊驅的主要有三個, 當然我不是說其他工作不存在, 主要是講能夠在數學歷史上很出名的有三個: 一個是陳省身教授在示性類方面的工作; 一個是華羅庚在多複變函數方面的工作; 一個是馮康在有限元計算方面的工作。 我為什麼單講華先生在多複變函數方面的工作, 這是我個人的偏見。 華先生在數論方面的貢獻是大的, 可是華先生在數論方面的工作不能左右全世界在數論方面的發展, 他在這方面的工作基本上是從外面引進的觀點和方法。可是他在多複變函數方面的貢獻比西方至少早了十年, 海外的數學家都很尊重華先生在這方面的成就。 , 華羅庚先生的最大成就在多元複變函數論); 即便是在華羅庚的所有代數工作中來看, 矩陣論方面的工作也不是最有影響的, 華羅庚關於體的半自同構的工作與在典型群方面的工作具有基本的重要性; 相對而言, 華羅庚在矩陣論方面的工作並非如此重要 --- 後繼者已經在比較一般的域 (而不限於華羅庚通常所考慮的複數域與實數域) 上推廣了這些結果甚至簡化了其證明。 但是, 對於華羅庚本人而言, 他在矩陣方面的貢獻對他之後工作的影響是不容低估的, 正如他的學生徐利治在總結華羅庚的治學與研究經驗時所一語道破的:

華先生很重視做學問需要有"看家功夫"。 所謂看家功夫指的是做科研時必不可少的最基本而有用的本事。 據他所說, 他扎實的看家功夫主要來源於三部經典著作。 一是 G. Chrystal 的《代數學》, 二是 E. Landau 的《數論教程》 (三大卷), 三是 W. H. Turnbull 與 A. C. Aitken 合著的《矩陣標準型理論引論》。 他說, 《代數學》使他學會了計算技巧, 《數論教程》使他獲得了從事數學研究的分析功底, 而《矩陣標準型理論引論》雖是一本薄薄的書, 卻是幫助他後來完成矩陣幾何和複分析 巨大研究成果的基本工具。}

需要補充的是, 對華羅庚後來的工作影響至深的還有 H. Weyl 的經典著作《古典群》2 2 無獨有偶, 陳省身先生對 Weyl 的《古典群》也推崇備至。根據吳文俊的回憶, 陳先生在中央研究院數學所主持工作的三年期間, 曾對數學所的年輕人指出:要進入近代數學之門, 應該好好學習三本書: L. Pontrjagin 的《連續群》, C. Chevalley 的《李群論》, 以及 H. Weyl 的《古典群》。而且事實上, 陳先生曾在一篇重要的文章中指出了 Kähler 流形上的 Lefschetz 定理實質上有著深刻的群論根源 (對此有興趣的讀者可以參見伍鴻熙第77-80頁), 做出這樣的洞察顯然與他熟悉 Weyl 的《古典群》是分不開的。 這在他的兩本專著《典型群》 (與萬哲先合著) 與《多複變數函數論中的典型域的調和分析》中深有體現。 事實上, 正如華羅庚的學生馮克勤在中所透露的:

華羅庚在討論班和日常談話中有許多觀點是大家熟知的, 例如他把"班門弄斧"反其道而行之, 主張 "弄斧一定到班門", 即研究工作一定要與大師交手, 才會有所提高。 他主張讀書要"從薄變厚, 再從厚變薄", 並舉例說他花了兩年的功夫念 Weyl 的群表示論的書, 終於弄懂了其中的精髓。我們在他的著作《多複變數函數論中的典型域的調和分析》中看到他是如何把群表示加以消化, 用自己獨特的矩陣技巧表達出來。

由此我們應該認識到, 對於作為數學家的華羅庚來說, 他最重要的才能之一是他在運用矩陣技巧方面的精深造詣。 如果不瞭解這一點, 就無法理解華羅庚 (及其學派) 在多元複變函數論上的成功。3 3 正如馮克勤在中回憶的: 曾肯成 (1927$\sim$2004)曾對 1970 年代的 中國科技大學的情景有這樣的概括, "龍生龍, 鳳生鳳, 華羅庚的學生會打洞。" 所謂打洞, 就是通過變換將方陣化成某種類型的稀疏方陣 (大部分元素為 0)

華羅庚對矩陣論有許多貢獻, 本文主要討論他在矩陣的標準型方面的工作。 萬哲先在華羅庚的論文選集的介紹中 用寥寥幾筆概括了華羅庚在這方面的貢獻:

華羅庚關於矩陣幾何和多元複變函數論的研究, 還促使他研究矩陣的分類問題, 例如, 複對稱矩陣和斜對稱矩陣在酉群相合下的分類, 一對 Hermite 矩陣在相合下的分類, 以及 Hermite 矩陣在正交群相合下的分類。

這個概括是不完全的, 特別是, 沒有提到華羅庚在 1960 年代初用中文發表 (但結果早在 1940 年代就已經得到) 的兩篇 工作。 (當然, 這兩篇中文文章也 沒有收入到中。)

華羅庚在 1940 年代的西南聯大完成了這些工作, 這期間他還獨立於 C. L. Siegel 開展了 多元複變函數自守函數論的研究, 並從中進一步開創了矩陣幾何學這一新領域。 這些研究正是華羅庚關於矩陣標準型工作的背景與動機所在。 事實上, 華羅庚在矩陣標準型方面的工作 主要包含在多元複變函數論與矩陣幾何的文章中, 見

1940年恰好也是華羅庚數學研究生涯中的一個分水嶺。 1940年以前, 他 (追隨德國、英國與俄國學派) 從事當時熱門的解析數論研究; 1940年以後, 他獨立地開展了多元複變函數論與矩陣幾何學的研究。 借助于徐利治的上述總結, 也許可以這樣簡單地概括:在1940年以前, 華羅庚的數學研究主要是 受到 Landau《數論教程》的影響; 在1940年以後, 對華羅庚影響 越來越深的是 Turnbull 與 Aitken的《矩陣標準型理論引論》。我們要介紹的就是, 後一影響在華羅庚的工作中的具體表現。

內容介紹

在具體介紹華羅庚的數學工作之前, 我們先來瞭解一下 他在1940年以前的數學生涯以及當時的整個時代背景 (注意到 1937$\sim$1945 在中國近代史上的特殊烙印), 這就是第一節的主要內容。 華羅庚自學成才的故事應該是家喻戶曉的, 但筆者深為觸動以至於在此忍不住想要舊事重提。 相信這一則小故事必定會引起讀者 (特別是在學學生) 的反省與深思。 對於這一故事已經熟悉的讀者可以直接跳過。

在第二節我們將回顧一下矩陣標準型方面的經典結果, 這也相當於提供了另一個觀點來看待本科線性代數的主要結果。 這裏我們特別要介紹 K. Weierstrass 與 G. Frobenius 的重要貢獻, 從某種意義上說, 正是他們的工作一起奠定了現在的線性代數之基礎, 這一點也許很值得瞭解 (參見)。

在第三節我們將用七個小節分別詳細介紹華羅庚論文 中關於矩陣標準型方面的代表性工作。 我們的論述不可能面面俱到, 因而將注意力集中於那些陳述起來比較簡潔明瞭的結果以及那些或多或少被忽略了的重要結果, 例如華羅庚重新發現的 Takagi 定理 (定理1)、 重新發現的屬於 Williamson 的關於复辛矩陣在辛相似下的標準型 (定理12) 等等。 我們特別強調了在華羅庚的工作中反覆出現的一個關於實矩陣的平方根的存在性引理 (見引理4與引理5) 及其代數基礎 (引理1)。 特別的, 第 § 3.5 節將介紹華羅庚在中 得到的關於辛對合矩陣的標準型以及它的一個漂亮應用 (引理2)。 事實上, 向讀者介紹這個漂亮結果正是本文的一個主要目的。4 4 據說, Dieudonné 習慣說, 數學家希望因為他們最難的定理而被人們記住, 但是大多數時候, 正是他們最簡單的結果在後人中流傳。 筆者期望, 在華羅庚先生關於矩陣的標準型的諸多工作中, 引理2至少能因其簡單性和優美性而流傳下去。

在第四節我們將要介紹 J. Williamson, 這個名字在第三節中反覆出現, 因為 華羅庚在矩陣標準型方面的許多工作都曾被 Williamson 研究過。 從某種意義上說, Williamson 是華羅庚在矩陣標準型工作方面的一個潛在對手, 每當我們提及華羅庚在矩陣標準型方面的諸多工作時, 就必定要反覆提到 Williamson 的早期工作, 正如每當我們討論華羅庚在多元複變函數論方面的開創性工作時就必定要提到 Siegel 的 著名論文辛幾何 (見) 一樣。

1. 插入:1940年以前的華羅庚

如王元、楊德莊《華羅庚的數學生涯》一書開篇所說的:

華羅庚是一個自學成才的數學家。他在初中畢業後僅念了半年職業高中, 即在家 自學數學。他在家鄉江蘇金壇所能見到的數學書籍只有一本《大代數》5 5 這裡的《大代數》當指後來在國內普遍採用的《范氏大代數》, 這是他1926年在上海參加珠算比賽獲得冠軍後用獎金所買的。 一本《解析幾何》, 以及一本約五十頁的《微積分》。此外還有兩本與數學有點關係的雜誌《科學》與《學藝》。 華羅庚在家一邊自學, 一邊寫過幾篇文章, 都屬於初等數學範圍。}

很難想像, 受教育如此之少的華羅庚後來竟憑藉自己的勤奮與天才而成為中國數學的一根頂樑柱。 華羅庚的人生轉折點出現在1930年。那一年他在《科學》上發表了 他的第二篇數學論文蘇家駒之代數的五次方程式解法不能成立之理由, 在這篇論文中, 華羅庚找出了蘇家駒1926年發表在《學藝》上的論文 代數的五次方程式之解法的錯誤。6 6 關於華羅庚這篇論文的創作過程, 見李文林 華羅庚因此而得到清華大學算學系 (後稱數學系) 主任熊慶來 (1893$\sim$1969) 的賞識, 得到在清華大學工作的機會:算學系聘他為圖書管理員。對於這段時期的華羅庚, 當時在清華就讀研究生院的陳省身 (1911$\sim$2004) 在學算四十年 (見) 一文中有敏銳的觀察和生動的回憶:

那時清華數學系最引人注意的人物, 當數華羅庚。羅庚江蘇金壇人, 和培經同鄉。

羅庚初中畢業後輟學在家, 就自修數學, 因為同鄉關係, 他與培經通信, 咨詢數學問題。 有一期《學藝》雜誌上一位先生"證明"五次方程式可解, 編者竟登載了。 羅庚能把錯誤找出, 因此數學系決定聘他為圖書管理員。 他1931年來清華, 辦公桌放在系主任熊先生辦公室外面, 不久就成了系裏的中心人物。 羅庚是一個十分活躍的人, 凡數學討論, 系內人事, 他無不參與。 他是確有數學天才的, 每天工作十幾個小時, 所以短期內便有文章在國外雜誌發表。 他的腿因幼時患傷寒症而跛, 又因沒有上過大學, 和大家出身不同, 以致有高度的不安全感。 他在數論、代數、多元複變函數論, 都有重要的貢獻。關於他的故事很多。 記得有一次, 他的一篇文章, 經某德國雜誌接受, 他站在科學館前, 逢人握手, 告此喜信。

在清華期間, 華羅庚一邊工作一邊學習。 當時算學系的教授有:研究單複變函數論的熊慶來, 研究數論的楊武之 (1896$\sim$1973), 研究微分幾何的孫光遠 (1900$\sim$1979) 以及 主要擔任基礎課教學的鄭桐蓀 (1887$\sim$1963), 教員有 周鴻經 (1902$\sim$1957), 唐培經 (1903$\sim$1988)。

學生中亦不乏佼佼者, 除了研究生陳省身與吳大任 (1908$\sim$1997) 之外, 還有 本科生莊圻泰 (1909$\sim$1997), 許寶騄 (1910$\sim$1970), 柯召 (1910$\sim$2002), 徐賢修 (1912$\sim$2002) 等。 華羅庚與這些精英一起聽課學習, 切磋琢磨, 受益良多。 因為他更多地得到了楊武之的指導, 所以他在此期間的興趣主要在數論。

楊武之, 1923$\sim$1928 年在芝加哥大學師從於美國代數與數論大家 L. E. Dickson (1874 $\sim$1954)。 學成歸來後, 在中國播灑下近世代數與數論的種子。 在 Dickson 的指導下, 楊武之在 1928 年的博士論文中證明了這樣的結果: 每個正整數都是九個金字塔數之和7 7 參見林開亮、張愛仙, 楊武之的九金字塔數定理,《數學傳播》, 2014年, 38卷 4期, 42-52。。 所謂金字塔數, 就是形如 ${{n+1}\choose{3}}=(n^3-n)/6$ $(n=1,2,3,\ldots)$ 的數。 這個結果是著名的 Lagrange 四平方和定理 (即每個正整數都是四個完全平方數之和) 的一個變體。 楊武之的這一堪與 Lagrange 定理相媲美的結果一定深深地打動了華羅庚, 這將他引向更一般的華林問題 (Waring's problem)。 華羅庚在清華讀到了 E. Laudau (1877$\sim$1938) 的一些優秀數論著作 (參照前面所引徐利治的話), 並對 Hardy-Littlewood-Ramanujan 的圓法與堆壘數論做了深刻的分析。 此外, 1935$\sim$1936年, 清華還邀請到法國數學家 J. Hadamard (1865$\sim$1963)與美國數學家 N. Wiener (1894$\sim$1964) 來校講學, 這使華羅庚受益良深。

1936年, 中國文化基金會資助華羅庚去英國劍橋大學進修, 由於資金有限, 他不是正式的研究生, 而是一個訪問學者。8 8 華羅庚選擇劍橋也許是因為受到 G. H. Hardy (1877$\sim$1947) 的吸引與 Wiener 的舉薦。 Hardy 與牛津大學的數論專家 J. E. Littlewood (1885$\sim$1977) 由於給出了 Hilbert-Waring 定理的定量化證明, 一起成為解析數論的領軍人物。 Hardy 一生最得意的發現不是某個數學結果, 而是印度的傳奇數學家 S. Ramanujan (1887$\sim$1920)。 Wiener 希望, 華羅庚作為中國的傳奇數學家也能得到 Hardy 的賞識。 可惜華羅庚去劍橋的那兩年 Hardy 恰不在劍橋。 另外, 根據陳省身先生的看法, 華羅庚去劍橋追隨 Hardy 未必是最好的選擇, 陳省身認為, 如果華先生到漢堡跟隨 E. Artin 搞代數數論, 日後的成就也許會更大。見張奠宙(p. 204)。 在此期間, 他與年輕的數論學家 H. Davenport (1907$\sim$1969), T. Estermann (1909$\sim$1991), H. Heilbronn (1908$\sim$1975), E. C. Titchmarsh (1899$\sim$ 1963) 以及 A. C. Offord (1906$\sim$2000), R. A. Rankin (1915$\sim$2001)交往頻繁, 受益匪淺。 他對華林問題做出了重要的改進, 發表了多篇文章。

1937年7月7日, 日本對中國發動全面的侵華戰爭。 1938年4月, 清華、北大、南開三校遷往雲南昆明, 合併創立西南聯大。 1938年, 華羅庚從英國回國, 任西南聯大數學系教授。 1938$\sim$ 1940年, 華羅庚將自己關於華林問題及其推廣的主要工作系統整理, 寫成專著《堆壘素數論》。由於時值戰亂, 付梓艱難, 他將書稿寄給蘇聯科學出版社出版。 由於第二次世界大戰的影響, 該書推遲至1947年才由蘇聯出版, 而中文修訂版則遲至1957年才出版。中文版之後又被譯成匈牙利文、德文、英文, 該書是華羅庚的第一本數學專著, 也是華羅庚最有影響的數論工作之一。

1940 年前後, 華羅庚將工作重點從數論轉移到分析、代數與幾何, 具體地說, 即多元複變函數論與矩陣幾何學。 注意到, 華羅庚此前完全沒有涉足這些領域。 事實上, 矩陣幾何學是華羅庚從多元複變函數論的研究中單獨開闢出來的新領域, 而當時從事多元複變函數論的數學家屈指可數, É. Cartan (1869$\sim$1951)與 C. L. Siegel (1896$\sim$1981) 是其中最有影響的人物, 但由於時值戰亂消息閉塞, 華羅庚對他們的工作知之甚少。 然而, 他憑藉深厚的矩陣功底在這一領域開拓出重要成果 (見, 詳細介紹可見陸啟鏗)。 而這也就是本文所討論的華羅庚在矩陣標準型方面的工作的研究背景與動機。

2. 矩陣的標準型之概論

矩陣的標準型這一課題由來已久, 揭開這一課題研究的是矩陣論的奠基人: 德國數學家 K. Weierstrass (1815$\sim$1897)。 第一次聽說這句話 --- 矩陣論的奠基人是 Weierstrass 而不是 A. Cayley (1821$\sim$1895) --- 的讀者也許會非常驚訝, 筆者第一次從 Thomas Hawkins 那裏聽到這個 說法時也有同樣的感受。 沒錯! Hawkins 正是這麼說的 (見(p. 156)):

通常 Cayley 被認為是矩陣論的奠基者。然而, 我在1977年的一篇文章中提議道, 雖然 Cayley 在1858年之前通過引進這一理論 (矩陣代數) 的一個方面確實發揮了特殊的作用, 但是對 Cayley 的工作如此定性則是一種歷史誤導。在賦予任何人這樣一個名稱的時候存在著 一個顯然的危險, 因為它採取的是一種過分簡單化了的歷史解釋。銘記這一警告, 我將提議, 就配得上矩陣論奠基人這一稱號的人來說, 這個人是 Weierstrass。}

Hawkins 將 Weierstrass 對矩陣論的貢獻概括為以下兩點: 第一, Weierstrass 在矩陣的初等因子理論 (也就是我們通常所說的 Jordan 標準型理論) 的基本性貢獻, 而這是矩陣論的基石。 第二, Weierstrass 通過引入分析的技巧 (攝動法) 處理退化 (不可逆) 矩陣, 從而使得對矩陣論做嚴格的數學研究成為可能。

Hawkins 進一步指出, 從某種程度上說, 雖然 C. Jordan (1838$\sim$1922) 也取得了與 Weierstrass 同樣的成就, 但是就各自的工作對後世的影響來說, 作為十九世紀數學發展的核心人物的 Weierstrass, 其影響 (特別是在矩陣論方面通過他的學生 Frobenius (1849$\sim$1917)9 9 關於 Frobenius 的數學工作的一個全面介紹, 可以參見 Hawkins 的新著, The Mathematics of Frobenius in Context, Springer, 2013. 的推進) 要大得多。因此, 他認為 Weierstrass 是當之無愧的矩陣論之父。

牽扯到歷史的話題總難免有一點沉重和不肯定, 我們還是來考慮更為輕鬆易懂的具體數學吧!

先來復習一下線性代數中關於矩陣的標準型方面的一些經典結果, 我們從 Jordan 標準型開始。 Jordan 標準型考慮的是一個複方陣 $A$ 在相似變換 $A\,\to P^{-1}AP$ 下的標準型, 如前所述, 這裏的基本結果屬於 Weierstrass 與 Jordan, 我們表述如下10 10 這個定理幾乎可見於所有的線性代數或矩陣論的教材, 特別的, 見華羅庚中 p. 57 定理1, 那裏沒有給出證明, 對此我們推薦 一書在附錄A2中給出的證明。

基本結果1 設複方陣 $A$ 的初等因子為 $(\lambda-\lambda_1)^{m_1},\ldots,(\lambda-\lambda_r)^{m_r}$, 則 $A$ 相似於一個下述形式的准對角矩陣11 11 我們用記號 $A_1\oplus\cdots\oplus A_n$ 表示對角塊依次為 $A_1,\ldots,A_n$ 的准對角陣。 $$J=J_{m_1}(\lambda_1)\oplus\cdots \oplus J_{m_r}(\lambda_r),$$ 這裏 $$J_m(\lambda)=\begin{pmatrix} \lambda &1&0&\cdots&0\\ 0& \lambda &1&\cdots&0\\ \vdots&\vdots& \ddots &\ddots&0\\ \vdots&\vdots&& \lambda &1\\ 0&0&\cdots&0& \lambda \\ \end{pmatrix}\in M(m,\mathbb{C}),$$ 而且 $J$ 由 $A$ 唯一確定, 至多在對角塊之間相差一個置換。

$J_m(\lambda)$ 稱為 Jordan 塊, 這些 Jordan 塊是由 $A$ 唯一確定的。

定理1有一個實數版本, 即實 Jordan 標準型, 見華羅庚中 p. 58 定理 2。

需要指出的是, 方陣之間的相似關係實際上有著極其自然的幾何背景: 基本的洞察是, 方陣 (或一般的矩陣) 其實是作用在向量空間之間的線性變換的 代數描述。因此, 從幾何的觀點來看, 線性空間與線性變換才是第一位的, 而線性變換在線性空間給定的一組基下的矩陣表示是第二位的 --- 因為前者是內蘊的, 而後者則依賴於所參考的那組基的選取。 這個依賴關係就體現為, 同一個線性變換在兩組基底之下對應的方陣是相似的。 因此, 當我們將方陣視為線性變換 (方陣 $A$ 對列向量的乘法給出一個線性變換) 時, 必須考慮方陣之間的相似關係。 這也就是相似關係之所以特別重要的原因。

另一方面, 方陣還可以視為雙線性型。對於方陣 $A$, 我們可以定義雙線性型 $f_A(x,y)=x'Ay$, 其中 $x,y$ 為列向量, $x'$ 表示 $x$ 的轉置。容易看出, 方陣 $A$ 與 $B$ 決定的雙線性型 $f_A$ 與 $f_B$ 等價 (雙線性之間的等價如何定義是自然的) 當且僅當存在可逆矩陣 $P$, 使得 $P'AP=B$。這就引出了矩陣相合的定義:兩個方陣 $A$ 與 $B$ 稱為相合的, 如果 存在可逆矩陣 $P$, 使得 $P'AP=B$。因此, 當我們將方陣視為雙線性型時, 一個頭等重要的問題就是確定矩陣在相合變換 $A\to P'AP$ 下的標準型。通常我們只考慮對稱的或反對稱的雙線性型12 12 一般問題由 V. V. Sergeichuk 在 Classification problems for system of forms and linear mappings, Math. USSR, Izvestiya 31 (3) (1988), 481-501中解決。 。所以, 對應的問題就一分為二: 分別確定對稱矩陣與反對稱矩陣在相合下的標準型。 在反對稱的情形, 結果比較簡單, 我們有下述一般結果:

基本結果2 設 $A$ 為複 (或實) 反對稱矩陣, 則 $A$ 複 (或實) 相合於一個下述形式的准對角矩陣 $$\underbrace{J_2\oplus \cdots \oplus J_2}_k\oplus 0,$$ 這裏 $$J_{2}=\begin{pmatrix} 0& 1 \\ -1&0 \end{pmatrix},$$ 而 $k$ 由 $A$ 唯一確定。

在對稱矩陣的情形, 複矩陣與實矩陣的情形有所不同, 對應的結果分別為:

基本結果3 設 $A$ 為複對稱矩陣, 則 $A$ 相合於一個對角陣 $[\underbrace{1,\ldots,1}_r,0,\ldots,0]$, 這裏 $r$ 由 $A$ 唯一確定。

基本結果4 設 $A$ 為實對稱矩陣, 則 $A$ 實相合於一個對角陣 $[\underbrace{1,\ldots,1}_p,\underbrace{-1,\ldots,-1}_q,0,\ldots,0]$, 這裏 $p,q$ 由 $A$ 唯一確定。

上述兩個結果實際上是關於複 (或實) 的二次型在等價關係下的標準型結果, 而且後一結果就是著名的 Sylvester 慣性定理 (其中$p,q$ 分別稱為正、負慣性指數), 它是解析幾何中討論二次曲線與二次曲面的仿射分類的代數基礎。

為了進一步研究的需要, 我們需要獲得矩陣在某種特定的變換下的標準型。 實際上, 這樣的問題極為常見。例如, 如果給定的空間 (不妨設是實的) 帶有一個度量因而成為了歐幾里得空間, 那麼我們所考慮的相似與相合應分別代之以實正交相似與實正交相合, 例如, 此時的基本結果 4 應代之以下述 :

基本結果5 設 $A$ 為實對稱矩陣, 則 $A$ 實正交相合於一個對角陣 $[\lambda_1,\ldots,\lambda_n]$, 這裏 $\lambda_1,\ldots,\lambda_n$ 由 $A$ 唯一確定, 至多相差一個置換。

用二次型的語言, 上述結果相當於給出了實二次型的所謂的規範型, 這一結果是解析幾何中討論二次曲線與二次曲面的歐幾里得分類的代數基礎。

注意到, 因為一個矩陣為正交矩陣當且僅當 $P^{-1}=P'$, 因此上述結果又可以表為下述等價形式:

基本結果6 設 $A$ 為實對稱矩陣, 則 $A$ 實正交相似於一個對角陣 $[\lambda_1,\ldots,\lambda_n]$, 這裏 $\lambda_1,\ldots,\lambda_n$ 由 $A$ 唯一確定, 至多相差一個置換。

基本結果6即關於實對稱矩陣的譜定理, 這是線性代數中最重要的一個定理。同樣的, 對實反對稱矩陣有一個類似的譜定理, 我們敘述如下:

基本結果7 設 $A$ 為實反對稱矩陣, 則 $A$ 實正交相似於一個下述形式的准對角矩陣 $$\mu_1J_2\oplus\cdots\oplus\mu_kJ_2\oplus 0,$$ 這裏 $\mu_1,\ldots,\mu_k$ 由 $A$ 唯一確定, 至多相差一個置換。

同樣的, 我們可以將基本結果7用正交相合的語言表述 (只需在基本結果7中的相似替換為相合), 從略。

如果我們考慮的不是實歐幾里得空間而是複的歐幾里得空間 (即酉空間), 則考慮複矩陣在酉相似與酉相合下的標準型是自然的。 事實上, 關於酉相似, 我們有下述極為重要的結果 (正規矩陣的譜定理):

基本結果8 設 $A$ 是正規矩陣, 則 $A$ 酉相似於一個對角陣 $[\lambda_1,\ldots,\lambda_n]$, 這裏 $\lambda_1,\ldots,\lambda_n$ 由 $A$ 唯一確定, 至多相差一個置換。

回憶起, 一個方陣 $A$ 稱為正規的, 如果 $A$ 與其共軛轉置 $\overline{A}'$ 可交換。 特別的, Hermite 矩陣 ($\overline{A}'=A$) 與酉矩陣 ($\overline{A}'=A^{-1}$) 都是正規矩陣, 因此基本結果8事實上包含了 Hermite 矩陣與酉矩陣的譜定理作為特例。 注意, 斜 Hermite 矩陣 ($\overline{A}'=-A$) 與 Hermite 矩陣之間僅僅相差一個虛數單位因子 $i$, 因此我們只需考慮 Hermite 矩陣。 Hermite 矩陣的譜定理在量子力學中具有基本的重要性。13 13 這在量子力學發展初期給人的印象是極為深刻的, 正如量子理論的偉大先驅 N. Bohr 在1925年的題為原子理論和力學的演講 (見[p.310]) 中所說的: 將使數學界感興趣的是, 由高等代數學創立的那些數學工具在新量子力學的合理表述中起到了如此重要的作用。 例如, 由 Born 和 Jordan 得出的 Heisenberg 理論中那些守恆定律的普遍證明, 是建立在可以追溯到 Cayley 並由 Hermite 特別發展了的矩陣論的基礎上的。 可以期望, 力學和數學相互促進的一個新時代已經開始了。

Hermite 矩陣與酉矩陣事實上與複數域 $\mathbb{C}$ 的共軛自同構密切關聯。 事實上, 對於一個複矩陣 $A$, 我們可以有兩種方式14 14 這個觀點從射影幾何學的角度來看是自然的, 廣義的射影變換實質上同時包含線性變換與共軛線性變換。 將它視為作為線性空間上的幾何變換 (或二元函數): 一種是視為線性變換 (或雙線性型), 一種是視為共軛線性變換 (或線性-共軛線性型)。 在後一種觀點下, 矩陣 $A$ 所代表的幾何變換與二元函數分別是 $x\to A\overline{x}$ 與 $g_A(x,y)=x'A\overline{y}$; 特別的, Hermite 矩陣對應著 Hermite 型。

因此, 對於一個複矩陣, 除了相似與相合兩類變換以外, 還有可以稱之為 共軛相似與共軛相合的兩類變換:$ A\to P^{-1}A\overline{P}$ 與 $A\to P'A\overline{P}$。

對於共軛相合變換, 如果僅限制於考慮 Hermite 矩陣, 則我們有 一個類似 (於實對稱矩陣) 的慣性定理:

基本結果9 設 $A$ 為 Hermite 矩陣, 則 $A$ 共軛相合於對角陣$[\underbrace{1,\ldots,1}_p,\underbrace{-1,\ldots,-1}_q,0,\ldots,0]$, 這裏 $p,q$ 由 $A$ 唯一確定。

關於複矩陣在共軛相似變換下的標準型的結果, 在通常的線性代數教科書甚至矩陣論的專著中都交代得很少, 但相關的結果對於幾何學的研究非常有用 (例如, 見)。這一標準型結果實際上直到1937$\sim$1938年才為 Jacobson, T. Nakayamana (部分工作是與 K. Asano 合作完成), J. Haantijes 等得到。 後來, 許寶騄 (1955年)15 15 實際上, 這一標準型結果在許以超第7章第4節中有詳細的表述, 作者相當於改編了許寶騄的論文。 與 Y. P. Hong (1984年) 又重新發現了這些結果。 這一結果本身當然具有基本的重要性, 但考慮到這些工作發生的時間, 可以看出這一結果對華羅庚的研究工作沒有影響, 因此我們略去不提。

有必要指出的是, 矩陣的相似(similarity)與相合(congruence)概念是 Frobenius 首次提出的, 而且是標準的。 共軛相似在許寶騄那裏稱為複相似 (而 Y. P. Hong 稱之為餘相似(consimilar)), 我們堅持用共軛相似這個稱謂。 共軛相合在華羅庚那裏 ((p.141)) 稱為相聯(conjunctive) 相合, 遵循華羅庚, 往後我們改稱共軛相合為相聯。

最後, 我們還要介紹一個在矩陣論的發展過程中起著重要作用的關鍵性結果。 該結果屬於 Frobenius, 他當時利用這一個結果解決了歷史上著名的相合變換問題 (congruent transformation problem)。 下面我們對這一問題做簡要的介紹。

我們知道, 事實上, 對於一般的矩陣 (不必是方陣), 還有一類更簡單的變換, 即相抵 (Frobenius 稱之為等價) 變換: $A\to PAQ$, 其中 $P,Q$ 可逆。 對此, 我們也有相當的標準型結果 (這裏我們只考慮方陣)。

基本結果10 設 $A$ 是一個複 (或實) 矩陣, 則 $A$ 相抵於一個對角陣 $[\underbrace{1,\ldots,1}_r,0,\ldots,0]$, 這裏 $r$ 由 $A$ 唯一確定。

事實上, 結果中的 $r$ 是矩陣 $A$ 的秩。因此, 這一結果相當於說, 秩是矩陣在相抵變換下的完全不變量。 另一方面, 根據基本結果2與3, 對於複的對稱 (或反對稱) 矩陣, 秩也是在相合變換下的完全不變量。 因此, 我們立即可以得出這樣的結論: 兩個複對稱 (或反對稱) 矩陣相抵當且僅當它們相合。 注意到, 相合的概念比相抵強, 因此必要性是平凡的。 而 Frobenius 在 1896 年提出的相合變換問題就是, 要直接論證充分性。 即要從兩個複對稱矩陣相抵推出它們相合, 這就是相合變換問題這一名稱的由來。 Frobenius 以下述結果 (這一結果本質上不屬於矩陣的標準型結果, 以示區別, 我們稱之為基本引理) 為基礎對這一問題給出了一個漂亮的解答。

基本引理1 設 $A$ 是一個複方陣, 且 $\det Aeq0$。 設 $A$ 的極小多項式的次數為 $m$, 則存在一個 $m-1$ 次的多項式 $\chi(z)$, 使得 $[\chi(A)]^2=A$。

Frobenius 對上述結果的證明建立在一個關於多項式的結果上, 這個結果值得單獨提出來, 因為該結果 (以及上述基本引理1) 的一個實版本後來為華羅庚得到 (見 § 3.2 引理1與 § 3.5 引理 4 以及 § 3.6 引理5)。

基本引理2 設 $\psi(z)$ 是一個 $m$ 次首一複係數多項式且 $\psi(0)eq0$, 則存在一個 $m-1$ 次首一多項式 $\chi(z)$ 使得 $\chi(z)^2-z$ 被 $\psi(z)$ 整除。

關於這兩個基本引理的證明以及對相合變換問題的應用, 我們 提請有興趣的讀者參考, Hawkins 在那裏給出了完整的討論。

正如 Hawkins 所指出的, Frobenius 的相合變換問題源於 Weierstrass 與 L. Kronecker (1823$\sim$1891) 對於矩陣對的標準型的研究。例如, Weierstrass 研究了矩陣對 $(A_1,A_2)$ 在相抵變換 $A_1\to PA_1Q,\,A_2\to PA_2Q$ (其中 $P,Q$ 為可逆矩陣) 下的標準型。 雖然這個問題也具有基本的重要性, 但是我們就此打住不再展開。

對於矩陣對的標準型理論的歷史與現狀, 我們推薦 P. Lancaster 與 L. Rodman 最近合寫的兩篇文章以及他們與 I. Gohberg 合著的書 , 這些文獻同時表明了, 矩陣標準型是一個豐富的課題。從某種意義上來說, 這個課題正是華羅庚 (與我們將在第四節介紹的 Williamson) 工作的延續與開拓。

3. 華羅庚的標準型工作

之前我們已經介紹了關於標準型的一些經典結果, 這裏我們將介紹華羅庚本人在這方面的一些貢獻。

前面所述的經典工作理所當然地被 Turnbull-Aitken, MacDuffee 等 作者收入到 1930 年代出版的矩陣論專著中。 作為 Turnbull-Aitken 的忠實讀者 (見前文所引徐利治的話), 華羅庚必定對這些經典工作瞭如指掌。 事實上, 部分結果後來被華羅庚收入到他編寫的矩陣論教材(pp.168--171)中。在該書第173頁, 華羅庚寫道:

我們有了一批群:正交群、辛群、酉群; 有了一批被分類的對象:對稱方陣、 反稱方陣、Hermite 方陣、正交方陣、辛方陣、酉方陣。 因此出現了一系列的問題, 在某一個特定的群下, 把每種特定的方陣分類。 例如, 對稱方陣的正交分類、辛分類、酉分類等。 如果再加上 "數的範圍", 就出現了種種問題。關於這些問題的專門研究, 我不在此一一列舉了。

事實上, 本節的主要內容就是對華羅庚的這段話的內容的一個充分發揮。 華羅庚在這裏所謂的分類, 其實與標準型典範型 (canonical form 或 normal form)同義。

3.1. 複對稱矩陣與反對稱矩陣在酉相合下的標準型

在 1944 年發表的第一篇關於多元複變函數的論文中, 華羅庚得到了複對稱矩陣與反對稱矩陣在酉相合下的標準型 (見中 pp.480--481 定理 5 與定理 7):

定理1 設 $Z$ 是一個 $n$ 階可逆複對稱矩陣, 則存在酉矩陣 $U$ 使得 $$U'ZU=[\mu_1,\ldots,\mu_n],$$ 這裏 $\mu_1,\ldots,\mu_n$ 是矩陣 $Z\overline{Z}$ 的特徵值的正平方根。

定理2 設 $Z$ 是一個 $n$ 階可逆複反對稱矩陣, 則存在酉矩陣 $U$ 使得 $$U'ZU=\mu_1J_2\oplus\cdots\oplus\mu_kJ_2,$$ 其中 $\mu_1,\ldots,\mu_k$ 為 $-Z\overline{Z}$ 的特徵值的正平方根。

事實上, 定理1是所謂的 Takagi 分解, 這個結果最早由日本數學家 T. Takagi (高木貞治, 1875$\sim$1960) 在 1924 年發現, 之後又相繼被 N. Jacobson (1910$\sim$1999), Siegel, 華羅庚, I. Schur (1875$\sim$1941) 等重新發現, 關於其歷史可以 參見。 特別值得一提的是, 楊振寧在 1962 年的文章 中也獨立地發現了定理 2 並將它應用于量子統計力學。 注意到定理1與定理2中的 $\mu_i$ 實質上是矩陣 $Z$ 的奇異值 (即 $Z\overline{Z'}$ 的各個特徵值的正平方根)。

我們只證明定理1, 定理2類似可證 (一個略微不同的幾何證明可見(pp.117--119))。 華羅庚的證明比較麻煩, 下述簡單證明屬於 Siegel(pp.14--15)

定理1的證明 令 $W=[\mu_1,\ldots,\mu_n]$。 因為 $Z\overline{Z}$ 為 Hermite 矩陣, 所以存在酉矩陣 $U_1$ 使得 $U_1Z\overline{Z}\overline{U_1'}=W^2$。 於是矩陣 $U_1ZU_1'=F$ 是對稱矩陣, 而且 $F\overline{F}=W^2$。 設 $F_1,F_2$ 分別是矩陣 $F=F_1+iF_2$ 的實部與虛部。因為 $W$ 是實的, 所以我們 得到 $F_1F_2=F_2F_1$; 即這兩個實對稱矩陣 $F_1$ 與 $F_2$ 是可交換的。 這就證明了存在一個實正交矩陣 $D$ 使得 $D'F_1D$ 與 $D'F_2D$ 同時為對角陣。 因此 $D'FD=R$ 也為對角陣 $[r_1,\ldots,r_n]$, 而且 $R\overline{R}=D'W^2D$。 因此數 $r_k\overline{r_k}(k=1,\ldots,n)$ 是 $\mu_1^2,\ldots,\mu_n^2$ 的一個置換, 我們顯然可以假定 $r_k\overline{r_k}=\mu_k^2$。

令 $U_2=[\sqrt{\frac{r_1}{\mu_1}},\ldots,\sqrt{\frac{r_n}{\mu_n}}]$, 則 $U_2$ 為酉矩陣而且 $U_2'WU_2=R$。 令 $U=\overline{U_2}D'U_1$, 則有 $UZU'=\overline{U_2}D'U_1ZU_1'D\overline{U_2}'= \overline{U_2}D'FD\overline{U_2}'=\overline{U_2}R\overline{U_2}'=W$; 證畢。

注記 華羅庚在中 p.481 的注記中指出, 定理1與定理2可以毫無任何本質困難地推廣到 $Z$ 不可逆的情形。 Siegel 的上述證明只考慮了 $Z$ 可逆的情形, 然而他的敘述(中 p.12 引理1) 卻沒有附加這個限制條件。很明顯, Siegel 也認為, 這個推廣是微不足道的。我們留給有興趣的讀者。

3.2. Hermite 矩陣對的相聯標準型與 Hermite 矩陣在辛相聯下的標準型

的續篇中華羅庚將一個原始的幾何問題化歸為下述代數問題 --- Hermite 矩陣在辛相聯下的標準型問題, 並解決了後一個問題。 兩個 $2n$ 階 Hermite 矩陣 $H_1$ 與 $H_2$ 稱為辛相聯的, 如果存在辛矩陣 $P$ 使得 $PH_1\overline{P}'=H_2$。 回憶起一個 $2n$ 階矩陣 $P$ 稱為辛矩陣, 如果滿足 $PJP'=J$, 其中 $$J=\begin{pmatrix} 0& I \\ -I&0 \end{pmatrix}$$ 域 $F$ 上所有 $2n$ 階辛矩陣構成一個群, 稱為辛群16 16 記得曾經聽老師說, 辛群的中譯名由華羅庚確定, 除此之外, 酉群的譯名也是華羅庚確定的。 , 記為 $Sp(2n,F)$。

華羅庚通過解決另一個標準型問題 --- 即一對 Hermite 矩陣在相合下的標準型 --- 而求出 Hermite 矩陣在辛相聯下的標準型。 Hermite 矩陣對 $G_1,G_2$ 與 $H_1,H_2$ 稱為相聯的, 如果存在一個可逆矩陣 $P$, 使得 $PG_1\overline{P}'=H_1,PG_2\overline{P}'=H_2$。 關於 Hermite 矩陣對的分類問題的討論在此前確實有很多工作。 例如, 華羅庚在中 p.544 的腳註中就指明了他當時在國內見到一些相關文獻, 其中有 Dickson, MacDuffee, Turnbull-Aitken , 以及 Logsdon 與 Muth 的兩篇文章。 他指出, 所有這些文獻中的處理都有錯誤, 有必要補救這個理論。17 17 根據 Turnbull 的說法, 早在1930年代, Williamson 也發現了同樣的問題, 但是他把補救的任務留給他的學生 G. R. Trott 作為博士論文的主題, 參見。 此外, Turnbull 本人在 1935 年也發表了一篇文章修正了 他與 Aitken 合寫的《矩陣標準型理論引論》中的相關錯誤, 在文中 (見中 p. 233的腳註) 他曾對 Williamson 表示感謝。 他的補救基於下述有趣引理 (見(p. 545), 請參照 § 2 基本引理2):

引理1 設 $q(x)$ 是一個實係數首一多項式, 沒有小於等於零的根, 則存在一個實係數多項式 $\chi(x)$ 使得 $\chi(x)^2-x$ 被 $q(x)$ 整除。

由於這個引理本身的重要性, 我們在此錄出華羅庚的證明如下。18 18 正如 H. Rademacher (1892$\sim$1969) 在《數學評論》上指出的 (見 MR0011134 (6,124c)), 該文含有許多討厭的印刷錯誤 (The paper contains quite a number of bothersome misprints), 此處我們已經修正。 需要指出的是, 這裏所討論的華羅庚的文章基本上都是在抗日戰爭時期的西南聯大完成的, 當時條件艱苦, 華羅庚在飛機轟炸中甚至遭遇了死裏逃生 (見中第29節劫難), 所以即便華羅庚出現很多書寫錯誤, 也完全可以理解。

證明 設 $$q(x)=\prod_{i=1}^s(x-a_i)^{l_i}\prod_{j=1}^t\big((x-\alpha_j)(x-\overline{\alpha_j})\big)^{m_j},$$ 其中 $a_i\gt 0$, $\alpha_j$ 是虛部不等於 $0$ 的複數。

第一步 首先證明引理對多項式 $$q(x)=(x-a)^l$$ 成立。 事實上, 引理對 $l=1$ 成立, 因為此時 $\chi(x)=\sqrt{a}$ 是一個解。 假定對 $l-1\geq0$ 我們有一個實係數多項式 $\chi_{l-1}(x)$ 使得 $$\chi_{l-1}^2(x)-x=(x-a)^{l-1}\lambda(x),$$ 這裏 $\lambda(x)$ 是一個實係數多項式。顯然 $\chi_{l-1}(a)eq0$。 於是 $$\chi_l(x)=\chi_{l-1}(x)-\frac{1}{2}\frac{\lambda(a)}{\chi_{l-1}(a)}(x-a)^{l-1}$$ 滿足我們的要求, 因為 \begin{align*} \chi_l^2(x)-x&\equiv\chi_{l-1}^2(x)-x-\frac{\lambda(a)}{\chi_{l-1}(a)}\chi_{l-1}(x)(x-a)^{l-1}\\ &\equiv\Big(\lambda(x)-\frac{\lambda(a)}{\chi_{l-1}(a)}\chi_{l-1}(x)\Big)(x-a)^{l-1}\\ &\equiv0\pmod{(x-a)^l}. \end{align*}

第二步 證明引理對 $$q(x)=\big((x-\alpha)(x-\overline{\alpha})\big)^l$$ 成立。事實上, 對 $l=1$, 多項式 $$\chi(x)=\frac{1}{\sqrt{2|\alpha|+\alpha+\overline{\alpha}}}(x+|\alpha|)$$ 滿足條件, 因為 $2|\alpha|+\alpha+\overline{\alpha}\gt 0$ 而且 \begin{align*} \chi^2(x)-x&=\frac{1}{2|\alpha|+\alpha+\overline{\alpha}}(x^2+2|\alpha|x+|\alpha|^2)-x\\ &=\frac{1}{2|\alpha|+\alpha+\overline{\alpha}}(x-\alpha)(x-\overline{\alpha})\\ &\equiv0\pmod{(x-\alpha)(x-\overline{\alpha})}. \end{align*}

假定對 $l-1\geq0$ 我們有一個實係數多項式 $\chi_{l-1}(x)$ 使得 $$\chi_{l-1}^2(x)-x=\big((x-\alpha)(x-\overline{\alpha})\big)^{l-1}\lambda(x),$$ 這裏 $\lambda(x)$ 是一個實係數多項式。 則可以直接驗證 $$\chi_l(x)=\chi_{l-1}(x)+\big((x-\alpha)(x-\overline{\alpha})\big)^{l-1}(bx+c)^l$$ 滿足我們的要求, 這裏實數 $b,c$ 滿足 ($b,c$ 的存在性很容易看出, 因為 $\alpha$ 不是實數且 $\chi_{l-1}(\alpha)eq0$。) $$\lambda(\alpha)+2(b\alpha+c)\chi_{l-1}(\alpha)=0.$$

第三步 設 $q_1(x)$ 與 $q_2(x)$ 是兩個互素的實係數多項式, 令實係數多項式 $\chi_1(x)$ 與 $\chi_2(x)$ 分別滿足 $$\chi_1^2(x)-x\equiv 0\pmod{q_1(x)}\qquad\text{與}\qquad\chi_2^2(x)-x\equiv 0\pmod{q_2(x)}.$$ 眾所周知, 存在兩個實係數多項式 $h_1(x)$ 與 $h_2(x)$ 使得 $$h_1(x)q_1(x)+h_2(x)q_2(x)=1.$$ 於是, 令 $$\chi(x)=\chi_1(x)h_2(x)q_2(x)+\chi_2(x)h_1(x)q_1(x)$$ 則有 $$\chi^2(x)-x\equiv 0\pmod{q(x)}.$$

反覆應用這一過程, 則我們得到了引理。證畢

華羅庚將這一引理用於 Hermite 矩陣的特徵多項式 (注意到 它是實係數的), 由此最終得到了 Hermite 矩陣對的相聯標準型結果, 即 中 pp.549--550 定理 17 與定理 18。 在華羅庚關於矩陣標準型方面的所有工作中, 這一結果的引用率是最高的, 為此我們將完整地敘述這一結果。 由於華羅庚原文中的記號有些複雜, 這裏我們參考了I. Gohberg, P. Lancaster, L. Rodman在 中 pp.96--97 的敘述:

定理3 設 $G_1,G_2$ 是兩個 $n$ 階 Hermite 矩陣, 其中 $G_2$ 可逆。 則 $G_2^{-1}G_1$ 的初等因子具有形式 $(\lambda-\lambda_1)^{n_1},\ldots,(\lambda-\lambda_\alpha)^{n_\alpha}, (\lambda-\lambda_{\alpha+1})^{n_{\alpha+1}},(\lambda-\overline{\lambda_{\alpha+1}})^{n_{\alpha+1}}, \ldots,(\lambda-\lambda_{\beta})^{n_{\beta}},(\lambda-\overline{\lambda_{\beta}})^{n_{\beta}}$, 其中當 $q=1,\ldots,\alpha$ 時, $\lambda_q$ 為實數, 而當 $q=\alpha+1,\ldots,\beta$ 時, $\lambda_q$ 不是實數。 而且存在一個 $n$ 階可逆矩陣 $T$ 使得 $TG_1\overline{T}'$ 與 $TG_2\overline{T}'$ 分別具有形式 \begin{align} TG_1\overline{T}'&={\varepsilon}_1K_1\oplus\cdots\oplus{\varepsilon}_{\alpha}K_{\alpha} \oplus \begin{pmatrix} 0&K_{\alpha+1}\\ \overline{K_{\alpha+1}}&0 \end{pmatrix}\oplus\cdots\oplus\begin{pmatrix} 0&K_{\beta}\\ \overline{K_{\beta}}&0 \end{pmatrix},\label{1}\\ TG_2\overline{T}'&={\varepsilon}_1P_1\oplus\cdots\oplus{\varepsilon}_{\alpha}P_{\alpha} \oplus\begin{pmatrix} 0&P_{\alpha+1}\\ P_{\alpha+1}&0 \end{pmatrix}\oplus\cdots\oplus\begin{pmatrix} 0&P_{\beta}\\ P_{\beta}&0 \end{pmatrix},\label{2} \end{align} 其中 $\varepsilon_q=\pm1(q=1,\ldots,\alpha)$, 而 $$K_q=\begin{pmatrix} 0&&&0& \lambda_q \\ 0&&& \lambda_q &1\\ 0&&&1&0\\ 0 & \lambda_q & 1 &&\vdots\\ \lambda_q&1&0&\cdots&0 \end{pmatrix},\qquad P_q=\begin{pmatrix} 0 &&&0& 1 \\ 0&&& 1 &0\\ 0&&&0&0\\ 0& 1 & 0 &&\vdots\\ 1&0&0& \cdots &0 \end{pmatrix} \quad \in M(n_q, \mathbb{C}). $$ 表達式 \eqref{1}\eqref{2} 由 $G_1$ 與 $G_2$ 唯一決定, 任意兩個這樣的表達式 僅僅相差 \eqref{1} 與 \eqref{2} 中的對角塊的一個同時置換。

此外, 作者在(p. 123)指出, 定理3早在十九世紀末就已經為 Kronecker, Weierstrass 所知, 而且為 Weierstrass 表述為上述形式, 二十世紀上半葉又 陸續被 Trott, Williamson, 華羅庚等重新發現。

通過一種迂回的巧妙方式應用定理3, 華羅庚關於 Hermite 矩陣 在辛相聯下的標準型結果, 此處不再贅述。 需要補充的是, 華羅庚最後指出了, 定理3可直接應用於解決 Hermite 矩陣 $H$ 在變換 $H\to P'H\overline{P}$ 下的標準型, 其中 $P'J\overline{P}=J$。 這是因為, 存在可逆矩陣 $P$ 使得 $P'J\overline{P}=J$ 且 $P'H_1\overline{P}=H_2$ 當且僅當 存在可逆矩陣 $P$ 使得 $P'iJ\overline{P}=iJ$ 且 $P'H_1\overline{P}=H_2$, 即 Hermite 矩陣對 $(H_1,iJ)$ 與 $(H_2,iJ)$ 相聯。

注記華羅庚 (以及 Siegel) 中的工作曾被 馮康 (1920$\sim$1993) 學派應用到他所開創的 Hamilton 體系的辛幾何算法理論 (見) 中。

3.3. Hermite 矩陣在正交相聯下的標準型

一文中華羅庚解決了 Hermite 矩陣在正交相聯下的標準型問題。 兩個 $2n$ 階 Hermite 矩陣 $H_1$ 與 $H_2$ 稱為正交相聯的, 如果存在正交矩陣 $P$ 使得 $PH_1\overline{P}'=H_2$。 華羅庚研究這個問題是很容易理解的, 因為正交群、辛群、酉群與線性群一起構成四類典型群。 華羅庚既然在中考慮了 Hermite 矩陣在辛相聯下的標準型, 那麼以正交群代替辛群考慮同樣的問題是自然的。 華羅庚中的主要結果 (該文定理5) 後來重新被 Y. P. Hong 在 1989 年的文章中得到, Hong 的符號和敘述更清晰易懂, 有興趣的讀者可以參見此文。

最後, 我們要特別指出, 華羅庚將他的一般結果應用於確定正交反對合在正交關聯下的標準型。 一個方陣 $A$ 稱為反對合, 如果滿足 $A\overline{A}=\pm I$, 進一步, 取正號的稱為第一類反對合, 取負號的稱為第二類反對合。 如果 $A$ 是第一類正交反對合, 則從條件 $AA'=I$ (正交) 與 $A\overline{A}=I$ (第一類反對合) 立即推出 $A$ 是 Hermite 矩陣, 因此可以對 $A$ 利用 Hermite 矩陣在正交關聯變換下的標準型結果。 同理, 若 $A$ 是第二類正交反對合, 則 $iA$ 是 Hermite 矩陣。這兩個小結果也許值得一提:

定理4

(i) 設 $A\in M(n,\mathbb{C})$ 是第一類正交反對合, 則存在正交矩陣 $P$ 使得 $$P'A\overline{P}=P^{-1}A\overline{P}=[\underbrace{1,\ldots,1}_p,\underbrace{-1,\ldots,-1}_q],$$ 其中 $p,q$ 由 $A$ 唯一確定。

(ii) 設 $A\in M(n,\mathbb{C})$ 是第二類正交反對合, 則 $n$ 是偶數, 且存在正交矩陣 $P$ 使得 $$P'A\overline{P}=P^{-1}A\overline{P}=\begin{pmatrix} 0& I \\ -I&0 \end{pmatrix}.$$

注記 我們之所以不在此敘述華羅庚關於 Hermite 矩陣的正交相聯與辛相聯的標準型, 除了篇幅的考慮以外, 還有一個重要的原因, 就是後來許寶騄與嚴志達、陳雅深分別對此給出了更好的表述與證明。

許寶騄在1957年發表的一篇長文中從一個更一般的角度同時考慮了 Hermite 矩陣在正交相聯與辛相聯下的標準型, 完善了華羅庚結果 (事實上還更正了華羅庚中的兩處錯誤)。許寶騄的處理基於 Turnbull 以及 他本人在1955年發表的兩篇關於矩陣的標準型的文章。 應該指出, 許寶騄的這些工作是極為重要的, 特別是, 這一工作給出了複方陣在共軛相似下的標準型。 有一點也許值得一提, 許寶騄對 Turnbull-Aitken 中的《矩陣標準型理論引論》也非常推崇。 根據江澤培的回憶, 1947年許寶騄從美國回到北京大學曾用該書為參考書講授矩陣論的課。 如果瞭解到 Turnbull-Aitken 中的 Aitken (1895$\sim$1967) 實際上在統計方面作出了不少貢獻, 這就不難理解了。同樣值得指出的是, 許寶騄在矩陣論方面的深厚造詣使得他的統計工作具有獨樹一幟的風格。19 19 從這一點來說, 與華羅庚、 許寶騄一樣, 陳省身的工作中也體現了他扎實的代數功底。 如徐利治所透露的 (見(p. 64)): 陳省身先生跟人講過, 他搞幾何之所以會比美國的幾何學家高明 一點, 就是與他年輕時學過霍爾(H. S. Hall)與奈特(S. R. Knight)合著的《高等代數》(Higher Algebra)有關係。 而美國的不少幾何學家青少年時代都沒有受過計算技巧方面很好的訓練

1958年, 嚴志達、陳雅深採取了幾何化的觀點處理了某一類標準型問題, 包含了華羅庚的相關結果。 嚴志達、陳雅深在緒言中寫道:

從代數的觀點來說, 這樣的問題屬於所謂二次型偶理論的一頁, 關於各種形式的二次型偶問題的討論, 由來已早。 但是由於近代群論方面的發展, 尤其是所謂對稱黎曼空間的理論, 使得這些問題重新得到新的幾何學的意義。華羅庚先生在他的一系列關於"矩陣幾何"的重要工作中也曾對這樣的問題有過很多的貢獻。 特別應該提出的是他的關於准酉空間對稱變換分類的研究 (按:即)。 A. I. Mal'cev 在他的《線性代數基礎》一書中利用了所謂"幾何的方法"對於各種不同形式的二次型偶做了比較詳細的討論, 其中自然包括了華先生的一些結果。}

3.4. 辛對合與辛反對合的標準型

中, 華羅庚給出了複辛矩陣在辛相似下的標準型。 H. Weyl (1885$\sim$1955) 向他指出, 這一結果已經為 J. Williamson 得到, 因此華羅庚只是簡要陳述了結果 (見 § 3.5 定理10) 而 沒有給出證明。出於幾何的考慮, 華羅庚將其 應用于最簡單的辛矩陣 --- 辛對合。按照定義, 一個矩陣 $A$ 稱為對合, 如果滿足 $A^2=\pm\,I$。取正號的稱為第一類對合, 取負號的稱為第二類對合。 華羅庚所得到的關於辛對合的下述標準型定理 (見中 pp. 196$\sim$197定理4與定理5):

定理5

(i) 設 $A$ 是第一類辛對合, 則辛相似於 $$\begin{pmatrix} H &0\\ 0& H \end{pmatrix},$$ 其中 $H=[\underbrace{1,\ldots,1}_p,\underbrace{-1,\ldots,-1}_q]$, 這裏 $p,q$ 由 $A$ 唯一確定。

(ii) 任一第二類辛對合一定辛相似於 $$\begin{pmatrix} 0& I \\ -I&0 \end{pmatrix}.$$

華羅庚在中 p.200 定理 7 還給出了辛反對合在辛共軛相似下的標準型:

定理6

(i) 設 $A$ 是第一類辛反對合, 則存在辛矩陣 $P$ 使得 $$P^{-1}A\overline{P}=\begin{pmatrix} 0& iI \\ iI &0 \end{pmatrix}.$$

(ii) 設 $A$ 是第二類辛反對合, 則存在辛矩陣 $P$ 使得 $$P^{-1}A\overline{P}=\begin{pmatrix} 0& iH \\ -iH&0 \end{pmatrix},$$ 其中 $H=[\underbrace{1,\ldots,1}_p,\underbrace{-1,\ldots,-1}_q]$, 這裏 $p,q$ 由 $A$ 唯一確定。

華羅庚將定理6的證明歸結為他早先的文章中關於 Hermite 矩陣的辛相聯標準型的一個簡單應用。 這裏基本的觀察有兩點:第一, $A$ 是第一類 (第二類) 辛反對合當且僅當 $iJA$ ($JA$) 是 Hermite 矩陣; 第二, $A$ 與 $B$ 辛共軛相似當且僅當 $JA$ 與 $JB$ 辛關聯。 因此, 可以先通過應用 Hermite 矩陣的辛相聯標準型得出 $iJA$ ($JA$) 的標準型, 再由此得到 $A$ 在辛共軛相似之下的標準型。

注記1 華羅庚後來在關於典型群的文章 中將定理 5(i) 推廣到一般的特徵不等於2的域, 也見於華羅庚與萬哲先合著的《典型群》 第十二章 (那裏給出了定理5在任意域上的推廣)。 應該指出, 定理 5(i) 之所以可以推廣到一般的域, 是因為本質上這個結果是幾何的。 事實上, 在華羅庚之前, J. Dieudonné 就用幾何的方法證明了這一結果, 見 中的敘述與所引的文獻。 最近, S. Beigi 與 P. W. Shor又重新發現了 《典型群》中所述的關於特徵等於2的辛對合的標準型, 他們是將華羅庚 中的方法 (針對特徵不等於2的域) 平移到特徵等於2的情形, 這實際上也就是《典型群》一書中所採用的方法。

注記2 Dieudonné 所應用的幾何方法的優越性在此值得重提。也許, 用 E. Artin 的一句話來評論 Dieudonné 與華羅庚的差異所在是合適的: 我的經驗是, 一個用矩陣進行的證明, 如果你拋開矩陣的話往往可以使這個證明縮短一半。至少在此處, 對於考慮對合這個具有幾何內涵的對象來說, 用幾何的方法更自然。事實上, 在矩陣的標準型工作方面, 幾何方法是極為有力的方法, 這一方法首先由 A. I. Mal'cev (1909$\sim$1967) 在他寫的教材 20 20 該書譯者為柯召, 他還翻譯了蘇聯數學家 F. R. Gantmacher 的專著《矩陣論》。 中 普及, 其影響在二十世紀下半葉的關於矩陣的標準型的文獻中幾乎隨處可見, 例如

注記3 華羅庚在 1945$\sim$1947年以矩陣幾何為題發表了三篇文章, 其中這裏所討論的文章事實上是幾何風味最濃的一篇。 華羅庚在文章中提出的對辛對合的研究引發了兩個方面的幾何研究。 一方面, 華羅庚曾指導孫本旺研究所有辛對合構成的流形的幾何, 孫本旺得到了一些成果, 並與 É. Cartan 的幾何工作聯繫起來。 另一方面, 華羅庚的這一工作影響了黃樹棠、吳大任、楊淦等在姜立夫 (1890$\sim$1978) 所開創的圓素與球素的幾何學方面的工作

3.5. 一對反交換的辛對合與正交對合的標準型 及其應用, 兩兩反交換的辛對合集的標準型及其應用

華羅庚在文章中還 (隱含地) 給出了一對反交換的第二類辛對合的標準型與一對反交換的第一類正交對合的標準型:

定理7 設 $A_1,A_2\in\,Sp(2m,\mathbb{C})$ 滿足 $$A_1^2=A_2^2=-I,\qquad A_1A_2=-A_2A_1,$$ 則存在 $P\in\,Sp(2m,\mathbb{C})$ 使得 $$ \qquad PA_1P^{-1}=\begin{pmatrix} iI &0\\ 0&-iI \end{pmatrix}\qquad \mbox{且}\qquad PA_2P^{-1}=\begin{pmatrix} 0& I \\ -I&0 \end{pmatrix}. $$

定理8 設 $B_1,B_2\in O(n,\mathbb{C})$ 滿足 $$B_1^2=B_2^2=I,\qquad B_1B_2=-B_2B_1,$$ 則 $n=2m$ 且存在 $P\in\,O(n,\mathbb{C})$ 使得 $$ PB_1P^{-1}=\begin{pmatrix} I &0\\ 0&-I \end{pmatrix}\qquad \mbox{且}\qquad PB_2P^{-1}=\begin{pmatrix} 0& I \\ I &0 \end{pmatrix}. $$

華羅庚是在求解一個有趣的矩陣問題的過程中獲得這些標準型結果的, 這個問題是:

對任意給定的正整數 $n$, 求 $r$ 的最大值, 使得存在 $r$ 個 $n$ 階辛矩陣 $A_1,\ldots,A_r$ 滿足下述關係: $$A_i^2=-I,\qquad A_iA_j=-A_jA_i \qquad(i=1,\ldots,r).$$

因為計算上的疏忽, 華羅庚未能徹底解決上述問題。21 21 這一點首先由黃用諏 (1913$\sim$2004) 在中指出。 但是, 按照華羅庚的思路, 不難完善這一工作。事實上, 為了解決他原先的問題, 只需要求出一對反交換的第二類正交對合與一對反交換的第二類辛對合的標準型22 22 此處定理 9 與定理 10 由筆者參照華羅庚的工作依葫蘆畫瓢給出。 請讀者原諒, 在敘述華羅庚的這部分工作時, 我們事實上作了少量補充與修改。 但是唯有如此, 才能使讀者對這一主題獲得較完整的認識。

定理9 設 $A_1,A_2\in O(n,\mathbb{C})$ 滿足 $$A_1^2=A_2^2=-I,\qquad A_1A_2=-A_2A_1,$$ 則 $n=4l$ 且存在 $P\in\,O(n,\mathbb{C})$ 使得 $$ PA_1P^{-1}=\begin{pmatrix} 0& I \\ -I&0 \end{pmatrix}\qquad \mbox{且}\qquad PA_2P^{-1}=\begin{pmatrix} J &0\\ 0&-J \end{pmatrix}. $$

定理10設 $B_1,B_2\in Sp(2m,\mathbb{C})$ 滿足 $$B_1^2=B_2^2=I,\qquad B_1B_2=-B_2B_1,$$ 則 $m=2l$ 且存在 $P\in\,Sp(2m,\mathbb{C})$ 使得 $$ PB_1P^{-1}=\begin{pmatrix} 0& iJ \\ iJ &0 \end{pmatrix}\qquad \mbox{且}\qquad PB_2P^{-1}=\begin{pmatrix} 0&-J\\ J &0 \end{pmatrix}. $$

一旦有了定理7$-$10, 就不難得到華羅庚論文中 pp.220--221 定理35的下述修正:

定理11 令 $n=2^q n_0$, 這裏 $n_0$ 是奇數。 設 $P(n),R(n)$ 分別表示使得方程 \begin{equation} A_i^2=-I,\qquad A_iA_j=-A_jA_i, \qquad(i=1,\ldots,r)\label{3} \end{equation} 在 $Sp(n,\mathbb{C})$ 與 $O(n,\mathbb{C)}$ 中有解的最大整數 $r$, 設 $Q(n),S(n)$ 分別表示使得方程 \begin{equation} B_i^2=I,\qquad B_iB_j=-B_jB_i, \qquad(i=1,\ldots,r)\label{4} \end{equation} 在 $Sp(n,\mathbb{C})$ 與 $O(n,\mathbb{C})$ 中有解的最大整數 $r$。 則有 $$ P(n)=\left\{\begin{array}{ll} 2q-1&\quad \textrm{若 $q\equiv0\pmod4$}\\ 2q+1&\quad\textrm{若 $q\equiv1\pmod4$}\\ 2q&\quad\textrm{若 $q\equiv2\pmod4$}\\ 2q-1&\quad\textrm{若 $q\equiv3\pmod4$} \end{array}\right.\qquad Q(n)=\left\{\begin{array}{ll} 2q-1&\quad\textrm{若 $q\equiv0\pmod4$}\\ 2q-1&\quad\textrm{若 $q\equiv1\pmod4$}\\ 2q+1&\quad\textrm{若 $q\equiv2\pmod4$}\\ 2q&\quad\textrm{若 $q\equiv3\pmod4$} \end{array}\right. $$ $$ R(n)=\left\{\begin{array}{ll} 2q&\quad\textrm{若 $q\equiv0\pmod4$}\\ 2q-1&\quad\textrm{若 $q\equiv1\pmod4$}\\ 2q-1&\quad\textrm{若 $q\equiv2\pmod4$}\\ 2q+1&\quad\textrm{若 $q\equiv3\pmod4$} \end{array}\right. \qquad S(n)=\left\{\begin{array}{ll} 2q+1&\quad\textrm{若 $q\equiv0\pmod4$}\\ 2q&\quad\textrm{若 $q\equiv1\pmod4$}\\ 2q-1&\quad\textrm{若 $q\equiv2\pmod4$}\\ 2q-1&\quad\textrm{若 $q\equiv3\pmod4$} \end{array}\right. $$

事實上, 定理11是下述兩個引理 (它們一起補正了華羅庚 中 p.221 的 (76)$-$(78) 與 (79)$-$(81)) 的簡單推論。

引理2 在定理11的條件下, 成立 \begin{equation} P(2n)=S(n)+2,\label{5} \end{equation} \begin{equation} S(2n)=R(n)+2,\label{6} \end{equation} \begin{equation} R(2n)=Q(n)+2,\label{7} \end{equation} \begin{equation} Q(2n)=P(n)+2.\label{8} \end{equation}

引理3 在定理 11 的條件下, 對於任意的奇數 $n_0$, 我們有以下初始值: $$ S(n_0)=1,\quad R(n_0)=0,\quad R(2n_0)=1,\quad Q(2n_0)=1. $$

由引理2與引理3很容易推導出定理11中 $P(n),Q(n),R(n),S(n)$ 的表達式。而引理2與引理3的證明很容易從 定理5 (及其正交版本) 與定理 7$-$10 得到。

注意到, 由引理2立即推出, $P(n),Q(n),R(n),S(n)$ 皆滿足以下週期性關係: \begin{equation} \lambda(16n)=\lambda(n)+8.\label{9} \end{equation}

特別要指出的是, 華羅庚在中只考慮了 $P(n),R(n),S(n)$ 而沒有考慮 $Q(n)$ (這正是華羅庚的證明中所 缺失的關鍵一環), 這就導致他未能得到 完整的引理2與引理3, 從而未能得到 $P(n),R(n),S(n)$ 正確表達式。 華羅庚當初所考慮的那個問題就是確定 $P(n)$ 的值, 這個值有其幾何上的含義。 對此, 華羅庚中 p.220 定理34所作的幾何論斷也須做相應的修正。

注記1 華羅庚原本有可能以一種最快的方式獲得定理11中 $P(n)$ (與 $S(n)$) 的表達式, 如果他能瞭解到, $R(n)$ 的表達式早在 1920 年代就為 A. Hurwitz (1859$\sim$1919) 得到的話。 Hurwitz 在曾考慮下述問題: 求正整數 $r$ 與 $n$ 所滿足的條件, 使得 $O(n,\mathbb{C})$ 中存在 $r$ 個矩陣 $A_1,\ldots,A_r$ 滿足 \eqref{3}。 1922年, J. Radon (1887$\sim$1956)對實矩陣考慮了對應的問題, 得到的結果與 Hurwitz 關於複矩陣的結果相同, 不過他將其結果表述成一種更加簡明的方式。 Hurwitz 與 Radon 的這一貢獻曾在 MacDuffee 的矩陣論專著 (p.81)中提到, 但那裏只引述了 Radon 的結果 (因為 Hurwitz 的結果引述起來過於複雜) 如下:

J. Radon 確定了最大數 $u(n)$ 使得存在 $u$ 個 $n$ 階實矩陣 $A_1,\ldots,A_u$ 滿足: 對任意的滿足 $x_1^2+\cdots+x_u^2=1$ 的實數 $x_1,\ldots,x_u$ 都有, $x_1A_1+\cdots+x_u A_u$ 為正交矩陣。如果 $n=2^{4\alpha+\beta}n'$, $n'$ 為奇數, $\beta=0,1,2,3$, 那麼這個值是 $u=2^\beta+8\alpha$。}

事實上, 按照 $R(n)$ 與 $u(n)$ 的定義, 不難看出, $R(n)=u(n)-1$。 因此, 借助於 Hurwitz-Radon 的上述定理 (對複矩陣), 立即就可以確定出 $R(n)=2^\beta+8\alpha-1$ (這與定理11中關於 $R(n)$ 的表達式是一致的), 從而進一步確定出 $S(n)$ 與 $P(n)$。 但是, 如果華羅庚真的這樣處理, 我們也許就看不到引理2這樣的美妙結果了。事實上, 在這裏, 結果本身 (定理11) 反倒不及它所依賴的基本事實 (引理2) 重要。

定理11包含了複數域上的 Hurwitz-Radon 定理 (即 $R(n)$ 的表達式), 而這一結果在代數、幾何、分析、拓撲各領域皆有廣泛的應用。 雖然 Hurwiz-Radon 定理在 Hurwitz 與 Radon 之後有了許多證明, 但是利用華羅庚的思想的上述證明是最能夠與 Hurwitz 與 Radon 的原始證明相媲美的一個 (關於 Radon 證明的可以一個中文介紹, 可以參見江上鷗 , 另一個初等證明可見 ); 而且, 引理2 (我們建議稱之為 華羅庚鏈) 對 $R(n)$ 所滿足的週期性關係 \eqref{9} 給出了一個深層次的解釋。

注記2 定理11、引理2與引理3還有一個"酉化"版本。 所謂酉化, 事實上就是酉限制 (在拓撲上相當於緊化), 例如, 複正交群 $O(n,\mathbb{C})$ 的酉化就是 $O(n,\mathbb{C})\cap U(n)=O(n,\mathbb{R})$ 即實正交群, 而複辛群 $Sp(2n,\mathbb{C})$ 的酉化則是 $Sp(2n,\mathbb{C})\cap U(n)=USp(2n)$ 即酉辛群 (現今流行的記號是 $Sp(n)$, 而且稱作緊致辛群)。 酉限制是一個強有力的技巧, 這一技巧為 Weyl 首創, 並且命名為"酉技巧", 見(p. 173)。正如 Weyl 在(p. 177)指出的, 酉技巧可以成功應用的原因在於, 酉限制不會喪失任何代數重要性。 引理2與引理3 (以及定理11) 的酉化之成立 也可以理解為是對 Weyl 這句話的一個例證。 Eckmann 在中強調, Hurwitz-Radon 定理與 Bott 週期性定理的關聯在於實 Clifford 代數的週期性。 酉化的引理2 (以及對應的週期性關係) 提供了一種途徑來理解這一關聯。

注記3 定理 11 中所研究的問題可以對任意的典型群 (線性群、正交群、辛群與酉群) 考慮。特別的, 華羅庚最初關心的那一個問題 (對應于辛群的情形) 可以放在任意的特徵不等於2的域上研究, 最近筆者通過推廣華羅庚的工作解決了這一問題。 對於正交群的情形, Hurwitz 與 Radon 分別研究了複數域與實數域的情形, 而且他們所得到的結果事實上對任意的特徵不等於2的域都成立, 可見筆者的介紹。 在複線性群的情形 (酉群的對應結果可依據 Weyl 的"酉技巧"還原為這一情況), 相應的問題則在 1930 年代首先為 Newman 與 Williamson 考慮, 而一般的特徵不等於2的可除環上的問題則為 Dieudonné在1953年首先解決。

3.6. 辛矩陣的辛相似

華羅庚關於辛矩陣的標準型工作後來經整理以中文發表於1962年《中山大學學報》, 見。 他在標題辛矩陣的辛相似下曾注明: 這是1945年的舊稿, 整理出來就正于中山大學諸同志。 華羅庚在中 p.5 定理6 給出了複辛矩陣在複辛相似下的標準型:

定理12 任意複辛方陣一定辛相似於以下形式的辛方陣的直和:

(I) $$\begin{pmatrix} J_r(\lambda)'&0\\ 0&J_r(\lambda)^{-1} \end{pmatrix},\qquad \text{($\lambda\neq\pm1$, 或者 $\lambda=\pm1$ 但 $r$ 是奇數)}$$

(II) $$\begin{pmatrix} J_r(\lambda)'& SJ_r(\lambda)^{-1} \\ 0&J_r(\lambda)^{-1} \end{pmatrix},\qquad \text{($\lambda=\pm1$, $r$ 為任意整數, $S=[1,0,\ldots,0]$)}$$

並且, 每一個支量不可分解為兩個低階辛矩陣的直和。23 23 事實上, 根據中的證明, 可以將定理4說得更清楚一些: 對於給定的辛矩陣的任意一個初等因子, 如果它形如 $(x-\lambda)^{2r}$, 其中 $\lambda=\pm1$, 則給出一個(II)型的辛矩陣; 而其它的初等因子都是成對出現的, 伴隨著每一對這樣的初等因子 $(x-\lambda)^{r}$ 與 $(x-\overline{\lambda})^{r}$, 給出一個(I)型的辛矩陣; 將如此得到所有的(I)型或(II)型的辛矩陣做直和就得到了 給定辛矩陣在辛相似下的標準型。

這裏特別要交代的是, 兩個辛矩陣的直和如下定義 (見)。 $$P_1=\begin{pmatrix} A_1 & B_1 \\ C_1&D_1 \end{pmatrix}\in Sp(2n_1,F),\qquad P_2=\begin{pmatrix} A_2 & B_2 \\ C_2&D_2 \end{pmatrix}\in Sp(2n_2,F), $$ 則定義 $P_1$ 與 $P_2$ 的直和為 $$\begin{pmatrix} A_1 &0&B_1&0\\ 0& A_2 &0&B_2\\ C_1&0& D_1 &0\\ 0&C_2&0& D_2 \end{pmatrix} $$ 這是一個 $2(n_1+n_2)$ 級的辛矩陣。24 24 在龍以明 的專著中, 上述乘積矩陣用記號 $P_1{\diamond} P_2$ 表示, 並稱為 $P_1,P_2$ 的 ${\diamond}$-乘積 (讀作:diamond 乘積)。但是直和的定義似乎應該追溯到 É. Cartan, 見 S. Helgason, Differential Geometry and Symmetric Spaces(Academic Press, 1962), p.351.

華羅庚還進一步得到了實辛矩陣在實辛相似下的標準型。 但這一結果曾被 Williamson 在 1937 年的文章 {normal forms for canonical matrices} 中得到。也許, 華羅庚已經通過 Weyl 瞭解到這一事實。

為了克服涉及到的困難, 華羅庚需要證明某些實方陣有實的平方根, 這就導致了 下述 (中 p.6 引理 2):

引理4 任一無零根及負特徵根的實方陣有實的平方根。

華羅庚指出, 引理4可以用的結果 --- 即引理1來證明。

證明 對給定方陣 $A$ 的特徵多項式 $q(x)$ 應用引理1, 則存在實係數多項式 $\chi(x)$ 使得 $$\chi^2(x)-x\equiv 0\pmod{q(x)},$$ 即對某實係數多項式 $\lambda(x)$ 有, $\chi^2(x)-x=q(x)\lambda(x)$, 在其中令 $x=A$, 則得到 $\chi^2(A)-A=q(A)\lambda(A)=0$。 令 $B=\chi(A)$, 則立即有 $B^2-A=0$, 即 $B$ 是 $A$ 的平方根。證畢

基於定理12與引理4, 華羅庚得到了實辛矩陣在實辛相似下的標準型 (中 p.10 定理 9)。

中, 華羅庚還指出了同樣的方法可以得到 H. Hilton (1876$\sim$1974) 關於複正交矩陣的相應結果。 這篇文章除了指明 Hilton 的這一工作的出處以外, 只多處引用了 Turnbull-Aitken 的《矩陣標準型理論引論》, 而沒有提到 Williamson 的相關工作。

注記 相對於中的標準型工作來說, 華羅庚 (以及下面將要談論的) 的工作或多或少被忽略了。 例如, 在龍以明學派關於實辛矩陣的標準型的工作 (例如) 中, 他們引用了 Williamson{normal forms for canonical matrices}而沒有提到華羅庚25 25 筆者就此曾與龍以明教授通信, 他作如下答復: {\fontsize{8}{10pt}\selectfont \ctxfk 此前我們不知道華羅庚先生的這篇文章, 因此沒有引用過。可能由於華先生的論文是用中文在《中山大學學報》發表的, 我們當時沒有查到。後來由於研究興趣的轉移, 沒有再去查過有關文獻。}另外, 龍教授 還特別指出, 他們在 中研究是的是一類比較特殊的 (非退化的或者特徵根在單位圓周上的) 辛矩陣的標準型, 目的是為了解決在辛道路的指標迭代研究中提出的問題。他們的工作是從應用的角度出發的, 為了 滿足具體問題的需要, 而研究了某一類辛矩陣的標準型。龍以明及其合作者的工作總結在專著中。 但是, 在胡金昌 (1906$\sim$1976) 的兩篇關於典型系統的文章中 提到了華羅庚的工作, 而且從本質上利用了華羅庚的結果。26 26 胡金昌在的標題下注明: 本文為1962年本校校慶科學討論會上作者提出一篇綜合性的報告的原稿。 在討論會上承華羅 庚教授提出寶貴建議, 認為可以用另方法證明報告中所提的一系列已有的成果。現在正根據 華教授的意見進行工作, 待遲日再行發表。胡金昌後來發表的工作即, 在文中他明確 提到, 華羅庚教授的《辛方陣的辛相似》 一文恰當地提供給作者所需要的材料。

3.7. 由實對陣矩陣與反對稱矩陣構成的矩陣對在相合下的標準型 及其應用

注意到, § 3.1$-$§ 3.3 只考慮了複矩陣, 如果考慮實的情形 (如華羅庚所述, "數的範圍"), 則得到以下課題:

課題1:實對稱矩陣 (或反對稱矩陣) 在正交相合下的標準型。

課題2:實對稱矩陣在辛相合下的標準型。

課題3:實對稱矩陣在正交相合下的標準型。

注意到, 課題1與課題3不是新的, 其結論就是 § 2 中的基本結果6, 7。 因此只有課題2可能是新的。華羅庚研究了課題2, 求出了 實對稱矩陣在辛相合下的標準型。 然而課題2並不是新的, 早在1936年, Williamson就解決了一個與之等價的問題, 因為從應用的角度來說, Williamson 的這一工作極為基本, 所以我們將略作介紹。

從 Hamilton力學的觀點來看, 最簡單的力學系統其 Hamilton 函數由二次函數給出: $$H(x,p)=\frac{1}{2}\big(x\quad p\big)\begin{pmatrix} A& B \\ B' &C \end{pmatrix}\begin{pmatrix} x\\ p \end{pmatrix}$$ 而對應的 Hamilton 方程具有以下形式: $$\dot{y}=Ky,\qquad K=JH$$ 其中 $$J=\begin{pmatrix} 0& I \\ -I&0 \end{pmatrix},\qquad H=\begin{pmatrix} A& B \\ B' &C \end{pmatrix}.$$ 即其對應的 Hamilton 向量場 $K$ 則由一個 Hamilton 矩陣給出, 因而是線性的 (最簡單的!) 向量場。 回憶起, 一個 $2n$ 階實矩陣 $K$ 稱為 Hamilton 矩陣, 如果 $JK$ 是對稱矩陣。27 27 Hamilton 矩陣也稱為線性典則變換(linear canonical transformation)。事實上, 所有的 $2n$ 階 Hamilton 矩陣 構成李群 $Sp(2n,\mathbb{R})$ 的李代數。 注意到, 物理上的典則變換 (canonical transformation) 即數學上的實辛變換。 於是, 將利用典則變換將二次型 Hamilton 系統化簡的問題, 事實上是一個典型的矩陣標準型問題: 求 Hamilton 矩陣在辛相似下的標準型。 Williamson解決了這一問題。

為看出 Williamson 的這一問題與華羅庚所考慮的實對稱矩陣在辛相合下的標準型的等價性, 只需要注意到:第一, 矩陣 $K$ 為 Hamilton 矩陣當且僅當 $JK$ 為對稱矩陣, 第二, 矩陣 $K_1,K_2$ 辛相似當且僅當 $JK_1,JK_2$ 辛相合。 (用群作用的話來說, 即辛群在 Hamilton 矩陣集上的相似作用與 在對稱矩陣集上的相合作用是等價的。)

對於, 特別值得一提的有兩點:

第一, 華羅庚強調, 處理實矩陣的標準型問題的關鍵 仍然是前面提到的關於實矩陣的平方根的存在性引理 (引理4), 而且華羅庚在中的陳述更為清晰 (見中p. 14引理, 參照 § 2 基本引理1):

引理5任一滿秩的、僅有非負特徵根的 實方陣一定有一實的 平方根, 而且它可以表為原方陣的實係數的多項式。

第二, 與 Williamson 一樣, 華羅庚首先解決了另一個更一般的標準型問題: 由一個實對稱矩陣與一個實反對稱矩陣構成的矩陣對的實相合標準型 (中 p.18 定理2)。 華羅庚從這一結果得出了以下標準型結果:

  1. 實矩陣的實相合標準型 (中 p.18 系2)。
  2. 實對稱矩陣在實辛相聯下的標準型 (中 p.18 定理3)。
  3. Lorentz 矩陣在 Lorentz 相似下的標準型 (中 p.25 定理9)。

華羅庚還特別指出了後一結果在球幾何與狹義相對論上的應用。此外, 在《從單位圓談起》一書第四講中, 華羅庚對於這一結果給出了一個自給自足的處理 (類似於實正交陣的標準型推導而不借助於 中關於矩陣對的標準型理論)。

注記 華羅庚在中考慮的矩陣對的標準型結果被後來 Thompson 的系統工作所涵蓋, Thompson 對華羅庚的工作顯然毫不知情。 同樣地, Lee 與 Weinberg 在中利用 Thompson 的結果求得了實矩陣的實相合標準型, 而這一結果也已經為華羅庚得到。

4. 華羅庚與 Williamson

在矩陣的標準型方面, 華羅庚應該是很早就通過 Weyl 瞭解到, 他的工作與 Williamson 有不少重複。 因為這裏主要介紹華羅庚的工作, 我們不打算詳細介紹 Williamson 的相關工作, 而只是簡單地來瞭解一下這位與華羅庚有著相同興趣 (矩陣論) 的前輩。

John Williamson (1901$\sim$1949), 蘇格蘭數學家。 1927年, Williamson 在芝加哥大學 Dickson 的指導下獲得博士學位 (而楊武之則在1928年得博士學位, 可以說 Williamson 是華羅庚的師伯)。得學位之後, Williamson 在霍普金斯大學找到了職位, 當時的數學系主任是 F. D. Murnaghan (1873$\sim$1976)。Murnaghan 對數學物理很有興趣, 他在1930年與1931年又聘來與他趣味相投的 A. Wintner (1903$\sim$1958)與 R. E. van Kampen (1908$\sim$1942)。 這些人的工作特別是 Wintner 關於 Hamilton 系統與微分方程的工作, 推動了 Williamson 去研究動力系統中的代數問題, 其中有一些可以歸結為矩陣的標準型問題。 從 1935 年開始, Williamson 考慮了各種類型的矩陣標準型問題, 在1935$\sim$1940年間, 他平均每年要發表兩篇關於這個主題的論文。 除了早期 (1929$\sim$1934年) 關於 (Gordan 意義下的) 經典不變量 的工作以外, 矩陣標準型工作是他最主要的貢獻。 此外, 他還以 Hadamard 矩陣的 Williamson 構造而著名。28 28 也許, 特別值得一提的還有 Williamson。 筆者在本刊所發表的文章中給出了 Hurwitz-Radon 定理的一個簡單證明, 其思想主要借用了 Newman中的一個想法。 Newman 在[p.272]指出, 正是 Williamson 向他指出了原文中的錯誤並提議了一個解決方案, 而且 Williamson 本人 在中也獨立地得到了正確的結果及其推廣。

Williamson 選擇研究矩陣的標準型問題是相當明智的。 一方面, 如前所述, 這些問題有具體的應用背景。 另一方面, Williamson 有這方面的基本訓練, 在入芝加哥大學之前, 他在英國愛丁堡大學主要受到他老師 Turnbull (1885$\sim$1961, Turnbull-Aitken 中的 Turnbull!) 的影響, 事實上他們還曾合作了一些文章。 他在芝加哥大學的導師 Dickson 更是一個長於計算的代數學家, 而且對矩陣論也很看重。 例如, C. C. MacDuffee (1895$\sim$1961), Dickson 的另一個學生 (1921年得博士學位), 也曾出版過一本矩陣論的專著。 Turnbull-Aitken、MacDuffee 與 Wedderburn 在 Williamson 的文章中經常被引用, Dickson 的文章和書常常也作為參考文獻出現。 跟 Dickson 的大多數門生一樣 (A. A. Albert (1905$\sim$1972)除外), Williamson 屬於"pre-van der Waerden"時期的一代。29 29 B. L. van der Waerden (1901$\sim$1996)在1930$\sim$1931年出版了兩卷本的《代數學》, 對近世代數的傳播與發展起到了巨大的推動作用。 說 Williamson 屬於"pre-van der Waerden"時期就是說他沒有深受近世代數的影響。 Williamson 雖然也像許多抽象代數學家那樣在任意一般的域上考慮問題, 但他的觀點仍然像經典的代數學家那樣是計算性質的, 而不是從近世代數所倡導的從結構的觀點出發。

在 Williamson 的所有工作中, 最有影響的工作也許正是關於 Hamilton 矩陣與辛矩陣的標準型工作, 即。 例如, 前者被 V. I. Arnold(1937$\sim$2010)作為附錄收入到他的經典之作《經典力學中的數學方法》一書中; 而後者的影響則可見 Wall 的長文與 Milnor 的短文

特別值得一提的是, 出於偏微分方程理論的 需要, L. Hörmander (1931$\sim$2012) 在 1995 年的 文章中重新考慮了 對稱矩陣在辛相合下的標準型, Hörmander 在引言中寫道:

這些結果不是新的, 因為 Williamson已經對任意的特徵零的域給出了一個完全 的分類。但是, 正是由於他的處理過於一般化, 中的結果與證明不如本文第二、 三節那麼清晰和簡單。 Laub 和 Meyer 曾給出一個顯式的標準型, 但在純虛數的情形, 他們列出了一個可分解的, 而其它兩個不可分解的是等價的。與此緊密相關的, Cushman 和 Duistermaat 給出了辛變換的分類, 但他們只給出了一組完全不變量, 而沒有給出標準型的顯式表達。}

如果 Hörmander 知道華羅庚的工作, 想必會更滿意的。

無論如何, 應該指出, 在矩陣的標準型方面, 雖然華羅庚的工作與 Williamson 有 不少重複, 但是華羅庚採用的方法更優越、更容易理解, 更便於應用。 例如對於實數域的情形, 華羅庚多次強調實矩陣平方根的存在 (引理 4 與引理 5) 之重要性; 再如, 華羅庚力求給出標準型矩陣的顯式表達 (他在(p.23)中有一節的標題是" 擺出來"); 而且華羅庚非常關注一般理論的特殊情形 (例如定理5給出的辛對合的標準型)。

當然, 華羅庚對矩陣標準型研究的最大特點在於, 其研究動機與背景來自於多複變元函數論與矩陣幾何。 例如, 在多元複變函數論的研究中, 華羅庚感興趣的是由 Élie Cartan 在1935年所定義的四類典型域。 從 F. Klein (1849$\sim$1925) 的幾何觀點來看, 一個重要的問題是決定這些典型域上的全純自同構群。 類比于單變量的情況, 這裏首先就會出現一個問題:該全純自同構群的作用是不是可遷的? 換言之, 該空間是不是齊性的 (任意兩點等價)? 注意到, 各類典型域由各種不同類型的矩陣組成, 而且可以觀察出全純自同構群有一個矩陣群作為子群, 所以這就遇到了矩陣的標準型問題。 華羅庚憑藉嫺熟的矩陣技巧, 得到了各類典型域是齊性的結論。 (決定出各類典型域的全純自同構群則由 Siegel、 華羅庚與其他數學家在 1943$\sim$1962 年間陸續完成。) 所以, 現在的研究對象就非常具體了: 一個矩陣群作用在矩陣集 (典型域) 上, 而且這個作用本質上是代數的。 沿著 Klein 的幾何觀點繼續往下走就會遭遇各種各樣的矩陣標準型問題。這就是華羅庚關於矩陣的標準型工作的背景。

小結 華羅庚與 Williamson 的工作有許多重複, 也許他對 Williamson 有一種 "既生瑜, 何生亮"的感慨。可惜的是, 在華羅庚去美國之前, Williamson 已遷居加拿大, 使得 華羅庚未能與這位前輩謀面。更為可惜的是, 在 Williamson 早逝之前, 他在矩陣論方面的獨特造詣還沒有找到薪火傳人。

華羅庚的工作晚於 Williamson, 而且不少工作都沒能及時發表, 雖然 1960 年代用中文發表了一些早期工作, 卻鮮為人知, 以至於一些外國同行重複了華羅庚的部分工作。

在矩陣的標準型工作方面, Williamson 與華羅庚是 二十世紀最有影響、最值得紀念的兩位先驅。

致謝 特別感謝的是, 南開大學數學所龍以明教授向筆者介紹了他們的相關工作。 感謝中科院數學所的陸啟鏗先生接受筆者的電話採訪, 他特別指出, 他從華先生那裡學到的一個技巧是矩陣的「極坐標」, 此外, 在他寫的多複變專著《典型流形與典型域》中還專門有一個關於矩陣論的附錄。 感謝審稿人向筆者提供了關於 Williamson 的諸多信息, 並對初稿提出了諸多指正。 在寫作過程中, 筆者還得到了中國科學技術大學劉會老師與首都師範大學趙潔同學的幫助, 特表感謝。

參考資料

V. I. Arnold, Mathematical Methods of Classical Mechanics, Springer-Verlag, 1989. 中譯本《經典力學中的數學方法》, 齊民友譯, 北京, 高等教育出版社, 2006。 S. Beigi, P. W. Shor, $\mathcal{C}_3$, Semi-Clifford and generalized semi-Clifford operations, Quantum Info. Comput. 10,1(January 2010), 41-59. N. Bohr, 《尼爾斯·波爾集》 (第五卷 量子物理學的基礎), 戈革譯, 北京, 科學出版社, 1991年。 S. S. Chern, On a generalization of Kähler Geometry, Algebra Geometry and Topology (Lefschetz Symposium), Princeton Universtiy Press, 1957, 102-121. 陳省身, 學算四十年, 《數學傳播》, 1(1976), No.2, 1-5。 L. E. Dickson, Modern Algebraic Theories, 1926. J. Dieudonné, On the automorphisms of classical group, Memoirs A.M.S. no.2(1951), 1-95. J. Dieudonné, On a problem of Hurwitz and Newman, Duke Math. Jour. 20(1953), 381-393. J. Dieudonné, La Géométrie des groupes classiques, Springer-Verlag, Berlin-Heidelberg-New York, 1955. 中譯本《典型群上的幾何學》, 萬哲先譯, 北京, 科學出版社, 1963。 B. Eckmann, Hurwitz-Radon matrices and periodicity modulo 8, L'Enseignement Mathmatique 35(1985), 77-91. B. Eckmann, Hurwitz-Radon matrices revisited: from effective solution of the Hurwitz matrix equations to Bott periodicity, The Hilton Symposium 1993 (Montreal, PQ), CRM Proc. Lecture Notes, 6, Amer. Math. Soc., Providence, RI, (1994), 23-35. K. Feng and M. Z. Qin, The symplectic methods for the computation of Hamiltonian equations, Numerical Methods for Partial Differential Equations, 1-37, Springer, 1987. 馮克勤, 我怎樣走向學習代數數論之路, 收入張繼平主編《新世紀代數學》, 北京大學出版社, 2002。 I. Gohberg, P. Lancaster, L. Rodman, Indefinite Linear Algebra and Applications, Birkhüser Verlag, 2005. J. Han and Y. Long, Normal forms of symplectic matrices (II), Acta Sci. Nat. Univ. Nankai. 32 (3) (1999), 30-41. T. Hawkins, Weierstrass and the theory of matrices. Arch. Hist. Exact Sci. 17(1977), 119-163. T. Hawkins, Frobenius and the symbolical algebra of matrices, Arch. Hist. Exact Sci. 62(2008), 23-57. Y. P. Hong, A canonical form for Hermitian matrices under complex orthogonal congruence, SIAM journal on matrix analysis and applications 10(1989), 233-243. L. Hörmander, Symplectic classification of quadratic forms and general Mehler formulas, Math. Z. 219(1995), 413-449. R. A. Horn and C. R. Johnson, Matrix Analysis, Cambridge University Press, 1985. 中譯本《矩陣分析》, 楊奇譯, 北京, 機械工業出版社, 2005。 胡金昌, 辛群與典型系統的穩定域, 《中山大學學報 (自然科學版) 》, 4(1962), 42-54。 胡金昌, 動力系統典型式的不穩定域, 《中山大學學報 (自然科學版) 》, 6(1964), 1-9。 L. K. Hua, On the theory of automorphic functions of a matrix variable I --- Geometrical basis, Amer. J. Math. 66(1944), 470-488. L. K. Hua, On the theory of automorphic functions of a matrix variable II --- the classification of hypercicles under the symplectic group, Amer. J. Math. 66(1944), 531-563. L. K. Hua, Orthogonal classification of Hermite matrices, Trans. A.M.S. 59(1946), 508-523. L. K. Hua, Geometries of Matrices II. Study of involutions in the geometry of symmetric matrices, Trans. A. M. S. 61(1947), 193-228. L. K. Hua, On the autmorphisms of the symplectic group over any field, Ann. Math. 49(1948), 739-759. L. K. Hua, Selected Papers of Loo-Keng Hua, edited by H. Halberstam, Springer, 1983. 華羅庚, 辛方陣的辛相似, 《中山大學學報 (自然科學版) 》, 4(1962), 1-12。 華羅庚, 方陣的實相合, 《中山大學學報 (自然科學版) 》, 4(1962), 13-31。 華羅庚, 萬哲先, 《典型群》, 上海, 上海科技出版社, 1963。 華羅庚, 《從單位圓談起》, 北京, 科學出版社, 1977。 華羅庚, 《高等數學引論》 (第四冊), 北京, 高等教育出版社, 2009。 黃樹棠, 吳大任, 圓 (球) 素幾何 (三), 拉氏圓常態辛反演的辛相似類, 《南開大學學報 (自然科學版) 》, 1987(1), 5-19。 黃樹棠, 圓 (球) 素幾何 (六), 仿射辛反演的辛相似類, 《南開大學學報 (自然科學版) 》, 1987(2), 11-25。 黃樹棠, 姜立夫圓 (球) 素幾何理論簡介, 《中山大學學報 (自然科學論叢) 》, 10 (1987), 115-131。 黃樹棠, 圓 (球) 素幾何 (八), 變態辛反演與實辛反演的辛相似類, 《南開大學學報 (自然科學版) 》, 1992(4), 64-79。 江上鷗, Hurwitz-Radon 問題 --- 等價和約化是處理數學問題的一種基本方法,《數學通報》, 1964 年 04 期, 29-35。 江澤培, 深切懷念許寶騄老師, 收入《道德文章垂範人間:紀念許寶騄先生百年誕辰》, 333-335, 北京大學出版社, 2010。 P. Lancaster, L. Rodman, Canonical forms for symmetric/skew-symmetric real matrix pairs under strict equivalence and congruence, Linear Algebra and its Applications 406 (2005), 1-76. P. Lancaster, L. Rodman, Canonical forms for hermitian matrix pairs under strict equivalence and congruence, SIAM Rev. 47(3), 407-443. J. M. Lee and D. A. Weinberg, A note on canonical forms for matrix congruence Linear Algebra Appl. 249 (1996), 207-215. 李文林, 關於華羅庚的第一篇數學論文, 《中國科技史料》, 3(1989), 83-85, 收入王元、楊德莊《華羅庚的數學生涯》附錄十。 林開亮, Hurwitz-Radon 矩陣方程, 《數學傳播》, 36(2012), No.1, 48-63。 K. L. Lin, Hurwitz-Radon's symplectic analogy and Hua's cyclic recurrence relation, Electronic Journal of Linear Algebra, 26(2013), 858-872. Y. Long and D. Dong, Normal forms of symplectic matrices, Acta Math. Sinica, 16 (2000), 237-260. Y. Long, Index Theory for Symplectic Paths with Applications. Progress in Math. 207, Birkhäuser, Basel, 2002. 陸啟鏗, 華羅庚在多複變函數論方面的工作與思想及其對數學與物理的影響, 收入 《傳奇數學家華羅庚 --- 紀念華羅庚誕辰100周年》, 丘成桐等主編, 北京, 高等教育出版社, 2010。 C. C. MacDuffee, The Theory of Matrices, Berlin, Springer, 1933. J. Milnor, On isometries of inner product spaces, Inventiones Math. 8 (1969), 83-97. A. I. Mal'cev, Foundations of Linear Algebra, W.H. Freeman, San Francisco, 1961 (Translation of Russian original of 1948). 中譯本《線性代數基礎》, 柯召譯, 北京, 高等教育出版社, 1959。 M. A. H. Newman, Note on an algebraic theorem of Eddington, J. London Math.Soc. 7(1932), 93-99, Corrigenda, 272. C. L. Siegel, Symplectic geometry, Amer. J. Math. 65(1943), 1-86. 孫本旺, 辛變換的幾何學I --- 辛反對偶所成的對稱黎曼空間, 《中國數學學報》 (新刊) 1(1951), 296-331。 R. C. Thompson, Pencils of complex and real symmetric and skew-matrices, Linear Algebra Appl. 147 (1991), 323-371. G. R. Trott, On the canonical form of a nonsingular pencil of hermitian matrices. Amer. J. of Math. 56(1934), 359-371. H. W. Turnbull, On the equivalence of pencils of hermitian forms, Proceedings of the London Mathematical Society, 39 (1935), 232-248. H. W. Turnbull, John Williamson obituary, Edinburgh Mathematical Notes 38(1952), 23-24. H. W. Turnbull, A. C. Aitken, An Introduction to the Theory of Canonical Matrices, Blackie and Son, London $\&$ Glasgow, 1932. B. L. van der Waerden, Modern Algebra, 第7版中譯本《代數學》, 第一卷 (丁石孫、曾成肯、郝炳新譯), 第二卷 (曹錫華、曾成肯、郝炳新譯), 科學出版社, 2009年。 G. E. Wall, On the conjugacy classes in the unitary, symplectic and orthogonal groups J. Austral. Math. Soc., 3 (1963), 1-62. 王元, 《華羅庚》, 南昌, 江西教育出版社, 1999。 王元, 楊德莊, 《華羅庚的數學生涯》, 北京, 科學出版社, 2000。 J. H. M. Wedderburn, Lectures on Matrices, Dover, New York, 1964 (first ed., 1934). H. Weyl, Classical Groups, Their Invariants and Representations, Princeton University Press, 1946. J. Williamson, Sets of semi-commutative matrices, I. Proc.Edinburgh Math. Soc. (Series 2) 3 (1933): 179-188. II. Proc. Edinburgh Math. Soc.(Series 2) 3 (1933): 231-240. J. Williamson, The equivalence of non-singular pencils of Hermitian matrices in an arbitrary field, Amer. J. Math. 57 (1935), 475-490. J. Williamson, On the algebraic problem concerning the normal forms of linear dynamical systems. Amer. J. Math. 58 (1936), 141-163. J. Williamson, On the normal forms of linear canonical transformations in dynamics, Amer. J. Math. 59(1937), 599-617. J. Williamson, Note on the equivalence of nonsingular pencils of Hermitian matrices, Bull. Amer. Math. Soc. 51 (1945), 894-897. Y. C. Wong, Isoclinic $n$-Planes in $2n$-Spaces, Clifford Parallels in Elliptic $(2n-1)$-Spaces, and Hurwitz Matrix Equations, Memoirs A.M.S. no. 41, 1961. 吳文俊, 中央研究院數學研究所一年的回憶, 收入《陳省身文選 --- 傳記、通俗演講 及其它》, 北京, 科學出版社, 1989。 伍鴻熙, 陳維桓, 《黎曼幾何選講》, 北京大學出版社, 1993。 徐利治, 回憶我的老師華羅庚先生 --- 紀念華老誕辰90周年, 《數學通報》, 2000。 徐利治, 袁向東, 郭金海, 《徐利治訪談錄》, 長沙, 湖南教育出版社, 2009。 許寶騄, 論矩陣的一種變換, 《數學學報》, 5(1955), 333-346。 許寶騄, 論矩陣偶的一種變換, 《北京大學學報 (自然科學版)》, 1(1955), 1-16。 許寶騄, 一個厄密方陣和一個對稱或斜稱方陣的聯合變換, 《北京大學學報 (自然科學版)》, 3(1957), 167-209。 許以超, 《線性代數與矩陣論》 (第二版), 北京, 高等教育出版社, 2008。 嚴志達, 陳雅深, 具反對合准 $U$ 空間的線性變換, 《數學學報》, 8(1958), 36-52。 丘成桐, 數學及其在中國的發展, 1997年在清華大學高等研究中心開幕上的講話, 《數學譯林》第20卷 (1999年), 194-201, 收入王元、楊德莊《華羅庚的數學生涯》附錄一。 C. N. Yang, Concept of off-diagonal long-range order and the quantum phases of liquid He and of superconductors, Rev. Mod. Phys. 34 (1962), 694-704. 張奠宙, 為陳省身先生寫傳是我畢生的榮幸, 收入《陳省身與中國數學》, 201-205, 吳文俊、葛墨林主編, 天津, 南開大學出版社, 2007。

---本文作者任教西北農林科技大學理學院---