38402 數學與現代文明

終極密碼

遊戲規則:本遊戲為猜密碼的遊戲。密碼為0到100之間的其中1個整數,電腦會提示密碼的所在範圍,玩家必須在6次之內猜到密碼才能過關。
★ 終極密碼為0到100之間 ★
您共有六次機會

演講者: 馬志明 (中科院應用數學研究所教授, 中科院院士)

時 間: 民國 103 年 5 月 8 日

地 點: 中央研究院數學研究所演講廳

整 理: 李竺祈

介紹(中央研究院數學研究所陳怡全教授): 今天的講者是來自中國科學院的馬志明院士, 馬院士的研究方向在機率方面, 最近幾年他關注機率在資訊、生物等其它領域的應用。 因為他在機率研究的貢獻, 1995 年當選中國科學院院士, 1998 當選第三世界科學院的院士, 現在是中國科學院數學和系統科學研究院的教授, 同時也是中國科學技術大學數學科學學院的院長。 今天很高興請到馬院士來做學術演講, 題目是數學與現代文明, 歡迎馬院士。

馬志明: 謝謝。我的題目是數學與現代文明, 我想講點數學在科學 (包括自然科學和人文科學) 當中的作用。 我到處宣傳數學跟所有其它的科學都不一樣, 因為它不僅有自身需要研究的課題, 而且還為其它自然科學和人文科學提供語言、 工具和方法。 中國有一句話叫數理化天地生。 我上學時常聽說, 學好數理化, 走遍天下都不怕。 其實這些話有一點不對, 因為數不應該跟理化天地生放在同一個位置。 比如, 在大學裡面數學是共同課, 但沒有把理化天地生拿來做共同課的。 所以數學在社會上的地位、在科學研究當中的地位, 我們應該充分地強調。另外, 數學這門學科發展的動力也和其它學科不一樣。

促進數學發展的動力

推動數學發展的動力有實際需求、有科學研究、有好奇心、還有純思維的邏輯思考、對美的追求。 正如一位數學家Moris Klein1 1 Moris Klein (1908$\sim$1992) 美國數學家, 著有多部有關數學史、 數學哲學以及數學教育的著作。在 Mathematics in Western Culture中所說: ``實用的、科學的、美學的和哲學的因素, 共同促進了數學的形成"。 當然所有這些推動數學發展的動力都離不開社會對數學的需求, 因此 Moris Klein 在上面那句話的後面又說:``另一方面, 數學家們登上純思維的頂峰, 不是靠他們自己一步步攀登, 而是藉助於社會力量的推動, 如果這些力量不能為數學家們注入活力, 他們就立刻會身疲力竭, 然後他們就僅僅只能維持這門學科處於孤立的境地, 雖然在短時間內還有可能光芒四射, 但所有這些成就會是曇花一現"。 上面的譯文取自張祖貴的譯本, Moris Klein的原文如下:

On the other hand, mathematicians reach their pinnacles of pure thought not by lifting themselves by their bootstraps but by the power of social forces. Were these forces not permitted to revitalize mathematicians, they would soon exhaust themselves; thereafter they could merely sustain their subject in an isolation which might be splendid for a short time but which would soon spell intellectual collapse.

數學跟我們的現代文明密切相關。 什麼是現代文明? 不論在捷運上還是公車上, 都可以看見年輕人隨時拿著手機操作, 這就是現代文明之一瞥, 年輕人接受現代文明的能力強。 網路、 手機、 多媒體、 DNA, 這些都是現代文明的特徵。

關於現代文明跟數學的密切關係, 不能說現代文明就是數學, 但可以說離開了數學, 就沒有現代文明, 就沒有這些多媒體, 沒有網路, 沒有手機。 DNA 的發現和研究, 也使得現代生命科學與數學密切相關。 以手機和多媒體傳輸為例, 我們現在可以隨時與美國的朋友通電話, 一幅圖片可以幾乎同步地從美國傳到台灣來。 這些聲音和圖片都是轉化為 0 和 1 這樣的信號來處理和傳輸, 其資料存儲量以 bit 為單位來計算, 一個 bit 就是一個 0 或一個 1。 一個 $640\times 480$ 中等解析度的彩色圖片, 資料存儲量為 737 萬 bit, 高品質地存儲一個人說話 1 秒的數據要 141 萬, 1 秒的電視圖像要 9920 萬。 這麼大的數據要存儲和處理, 還要傳輸, 傳到遠處去, 所有這些都離不開數學, 要用到很多不同分支的數學。 比如小波分析、圖論與圖演算法、隨機分析、統計與機器學習、數值分析、微分方程、壓縮感知、矩陣完備化等。 最近這幾年, 壓縮感知 (Compressed sensing) 和矩陣完備化 (Matrix completion) 在應用數學領域和資訊領域發展的特別迅速, 得益於 Terence Tao2 2 Terence Tao 陶哲軒 (1975$\sim$) 華裔澳洲-美國數學家, 研究方向廣泛, 包括調和分析, 偏微分方程, additive combinatorics, 遍歷 Ramsey 理論, 隨機矩陣及解析數論, 2006年獲頒費爾茲獎。、 Donoho3 3 David L. Donoho (1957$\sim$) 美國史丹佛大學統計、電機教授, 在理論和計算統計以及信息處理上, 有根本的貢獻。、 Candes4 4 Emmanuel Candes (1970$\sim$) 法-美數學家, 美國史丹佛大學數學、 統計、 電機教授, 在影像處理, 多尺度分析以及壓縮感知有重要貢獻。等這些一流數學家的突出貢獻。 Terence Tao 大家都知道, 他是一位獲得 Fields 獎的華裔數學家, 在純數學和應用數學的多個領域都做得非常好。

小波分析

我們來說說小波分析。 小波分析在數據壓縮、傳輸方面有很重要的作用。 小波分析是當前數學裡面迅速發展的新領域, 不僅有深刻的理論, 而且應用十分廣泛, 在很多不同領域都有非常重要的應用。 關於小波分析的發展歷史, 最早是由傅立葉分析裡面出來的, 1910 年 Haar 最先提出簡單的小波, 經過一段時間的發展後, 1985 年 Meyer5 5 Yves F. Meyer (1939$\sim$) 法國數學家、 科學家, 是小波理論的奠基者之一。和稍後的 Daubeichies6 6 Ingrid Daubeichies (1954$\sim$) 比利時物理學家以及數學家, 任教 Duke 大學, 以在小波以及影像壓縮上的工作最為著名。提出了正交小波基, 形成小波研究的高潮。 後來 Daubeichies 寫了「小波十講」, 我不知道在台灣有沒有, 在大陸有中文本, 非常受歡迎。 現在 Daubeichies 是國際數學聯盟的主席。 舉這個例子是非常有趣的, 為什麼呢? Daubiechies 本人是物理學出身, 她大學本科是物理, 博士學位是物理, 而且還當了幾年的物理老師, 但是現在數學家把她選為國際數學聯盟的主席。 可見數學的發展到了今天已經不拘于傳統的界限, 純數學應用數學也沒有明確的界限。 我在一些公眾報告和其它場合經常講, 要嚴格的區分純數學和應用數學是很難的, 實際上純粹數學和應用數學越來越融合, 而且基礎數學的內涵也在發展變化, 不僅基礎數學的內涵在發展, 現在基礎數學的一些內容跟理論物理也有融合。

電磁波的故事

剛才說到訊息的存儲和處理, 現在來說訊息的傳播。 訊息怎麼能從臺北到了美國的華盛頓去, 能夠傳這麼遠, 這裡最基本的傳播媒介就是電磁波。 發現電磁波的故事非常有趣, 這裡面也有數學的功勞。楊振寧先生在多篇文章或講演中對此事有很好的記述, 這裡我與大家分享一下楊振寧講述的故事。 關於物理中的數學公式, 我們在中學就學過庫倫定律、高斯定律, 這是物理裡面最基本的一些定律。 比如說庫倫定律就是兩個電荷之間的排斥力或吸引力與它們的電量成正比, 與距離平方成反比, 高斯定律描述兩個磁體之間的排斥力或吸引力, 也是和磁量成正比, 與距離平方成反比, 還有安培定律描述從電到磁的轉換, 法拉第定律描述從磁到電的轉換, 所有這些可以歸結為後來被稱為 Maxwell equation 的方程組: \begin{equation*} \left. \begin{matrix} p'=p+\frac{df}{dt}\\ q'=q+\frac{dg}{dt}\\ r'=r+\frac{dh}{dt}\\ \frac{d\gamma}{dy}-\frac{d\beta}{dz}= 4\pi p'\\ \frac{d\alpha}{dz}-\frac{d\gamma}{dx}= 4\pi q'\\ \frac{d\beta}{dx}-\frac{d\alpha}{dy}= 4\pi r' \end{matrix} \right\} \quad \bigtriangledown \times H=\frac{4\pi}c j + 1/c\frac{\partial E}{\partial t} \end{equation*} \begin{equation*} \left. \begin{matrix} \mu\alpha=\frac{dH}{dy}-\frac{dG}{dz}\\ \mu\beta=\frac{dF}{dz}-\frac{dH}{dx}\\ \mu\gamma=\frac{dG}{dx}-\frac{dF}{dy} \end{matrix} \right\} \quad \begin{gathered} H=\bigtriangledown\times A \\ \text{or}\\ \bigtriangledown \cdot H=0 \end{gathered} \end{equation*} \begin{equation*} \left. \begin{matrix} P=\mu(\gamma\frac{dy}{dt}-\beta\frac{dz}{dt})-\frac{dF}{dt}-\frac{d\psi}{dx}\\[5pt] Q=\mu(\alpha\frac{dz}{dt}-\gamma\frac{dx}{dt})-\frac{dG}{dt}-\frac{d\psi}{dy}\\[5pt] R=\mu(\beta\frac{dx}{dt}-\alpha\frac{dy}{dt})-\frac{dH}{dt}-\frac{d\psi}{dz} \end{matrix} \right\} \quad \begin{gathered} E=-1/c\frac{\partial A}{\partial t}-\bigtriangledown\phi \\ \bigtriangledown \times E =-1/c\frac{\partial H}{\partial t}\\ \bigtriangledown\cdot E = 4\pi \rho \end{gathered} \end{equation*} \begin{equation*} e+\frac{df}{dx}+\frac{dg}{dy}+\frac{dh}{dz}=0 \end{equation*} 左面這一組偏微分方程看起來很複雜。 其實我們在大學學過場論和向量後, 可以把左面的方程組用簡潔的向量方式表達出來。 左面那一組非常複雜的 Maxwell 方程, 用向量可以表示為如下簡潔的 4 個方程式。 \[ \begin{array}{llll} abla \cdot E &= & 4 \pi\rho & \mbox{庫倫定律} \\[5pt] abla \cdot H &= & 0 & \mbox{高斯定律} \\[5pt] abla \times H &= & 4 \pi j + \dot{E} & \mbox{安培定律} \\[5pt] abla \times E &= & - \dot{H} & \mbox{法拉第定律} \end{array} \] 這就是數學的魅力。 這是 Maxwell 的功勞, 而他最大的功勞是在把剛才這些物理定律寫成統一的數學公式後, 發現這一組公式有一丁點不相容, 就自作主張地在這裡加了一項 $\dot{E}$, 這是電場強度, 電場對時間的導數。 加了這一項之後發現這四個公式變得相容了, 而且也不違反原來的物理定律, 對物理的直觀沒有傷害。 加了之後, 奇蹟出現了, 加了這一項之後他發現電和磁會產生電磁波, 他從這組公式裡算出了電磁波的速度, 發現電磁波傳播的速度跟當時剛剛發現的光的傳播速度是一樣的, 將近每秒三十萬公里, 因此他提出電磁波和光是一回事, 光就是電磁波。 這一發現使得物理學中關於電、磁、光之間的關係整個改觀了。 我們今天關於電學、磁學和光學的瞭解和應用, 現代文明的無線傳播、電視、手機等等, 都是後來的物理學家、發明家和工程技術專家根據 Maxwell 公式漸漸發展出來的。 電磁波的發現對於我們的現代文明有重大影響, 在這方面數學功不可沒。 還可以舉出許多例子來說明現代數學的一些分枝與當代物理有深刻聯繫, 比如非歐幾何和引力場, Hilbert 空間和量子力學, 纖維叢和規範場。 大家熟悉的兩位華人大師, 一位物理大師楊振寧, 一位數學大師陳省身, 楊振寧是規範場理論的專家, 陳省身是纖維叢理論專家。 楊振寧曾經對陳省身講, 他對規範場恰好就是纖維叢上的聯絡感到震驚, 而數學家發展纖維叢並沒有考慮物理世界。 他還說:「這令人又激動又迷惑, 因為不知道你們數學家從什麼地方想像出這些概念來。」 陳省身立刻抗議: 「不, 不。 這些概念並不是想像出來的, 他們是自然和實在的。」

搜尋引擎與網路排序7 7 參看 M. Ram Murty, How Google Works --- 搜尋引擎中的線性代數, 數學傳播季刊第 36 卷第 3 期 (143號), 12-23.

網絡也是我們現代文明的一個特徵。請大家看這個網頁,

這是我在 Google 中搜尋中央研究院數學所出現的頁面。 頁面上標記有 147 萬條結果, 用時 0.25 秒。 排在最前面的是中央研究院數學所的主頁, 下面這幾項都是很重要的, 最重要的放在前面。 電腦很聰明, 並沒有把 147 萬條結果不排序地全部列出, 而是把最重要、 最相關的結果排在前面。 電腦怎麼會識別哪些結果比較重要, 哪些結果比較不重要呢? 它能讀懂這些頁面的內容, 然後根據內容來確定頁面的重要性嗎? 顯然不可能, 現在的電腦還沒有發展到那麼先進。 實際上很多搜尋引擎公司做的一件主要的事, 就是網頁的排序。 網頁排序包括重要性排序和相關性排序, 都要用到數學。 相關性排序我今天可能沒時間講, 我就講講網頁的重要性排序, 這也是數學在現代文明的一個有趣應用。 下面我用機率論和馬氏過程理論來說明網頁重要性排序的數學原理。

這裡右邊是我們的互聯網, 當然裡面有上萬上億個網頁, 為了能夠說明清楚, 這裡就假定我們有 6 個網頁。 假如你現在瀏覽頁面 1, 頁面 1 有兩個超連結, 一個指向 2, 一個指向 3, 下一步你很可能點一個超連結就到頁面 2, 或另一個超連結到頁面 3, 也就是說從頁面 1 出發, 可能有 1/2 的機率到頁面 2, 1/2 的機率到頁面 3。 同樣的道理假如從頁面 3 出發, 頁面 3 有三個超連結, 所以在瀏覽頁面 3 的時候, 可能有 1/3 的機率到頁面 1, 1/3 的機率到頁面2, 1/3 的機率到頁面 5, 以此類推。 如果你現在瀏覽的頁面沒有向外的超連結, 比如頁面 2, 那麼在瀏覽頁面 2 時, 下一步也許有相同的機率到任何一個其它頁面。 當然我這樣描述的上網動作並不全面, 因為你也可能不順著超連結到下一個頁面, 而是通過輸入一個關鍵詞或著是一個網址進入下一個頁面。 假定有機率 $\alpha$ 順著超連結到另外一個頁面, 同時有 $1-\alpha$ 的機率通過輸入一個網址或是關鍵詞去到另外一個頁面, 這兩個動作綜合起來就是我們上網衝浪的動作。 這是兩種隨機遊動組合成的一個隨機遊動, 連續上網衝浪的動作構成一個馬氏鏈, 它的轉移機率由我們剛才描述的兩個上網動作來確定。 在上面的例子中, 如果取 $\alpha=0.85$, 那麼馬氏鏈的轉移機率矩陣是: \[ \mathbf{P(0.85)}= \begin{bmatrix} \frac{0.15}6 & \frac{0.85}2\!+\!\frac{0.15}6 & \frac{0.85}2\!+\!\frac{0.15}6 & \frac{0.15}6 & \frac{0.15}6 & \frac{0.15}6 \\[5pt] ~\frac{0.85}6\!+\!\frac{0.15}6 ~&~ \frac{0.85}6\!+\!\frac{0.15}6 ~&~ \frac{0.85}6\!+\!\frac{0.15}6 ~&~ \frac{0.85}6\!+\!\frac{0.15}6 ~&~ \frac{0.85}6\!+\! \frac{0.15}6 ~~&~~ \frac{0.85}6\!+\!\frac{0.15}6 ~\\[5pt] \frac{0.85}3\!+\!\frac{0.15}6 & \frac{0.85}3\!+\!\frac{0.15}6 & \frac{0.15}6 & \frac{0.15}6 &\frac{0.85}3\!+\!\frac{0.15}6 & \frac{0.15}6\\[5pt] \frac{0.15}6 & \frac{0.15}6 &\frac{0.15}6 & \frac{0.15}6 & \frac{0.85}2\!+\!\frac{0.15}6 &\frac{0.85}2\!+\!\frac{0.15}6 \\[5pt] \frac{0.15}6 & \frac{0.15}6 &\frac{0.15}6 & \frac{0.85}2\!+\!\frac{0.15}6 & \frac{0.15}6 &\frac{0.85}2\!+\!\frac{0.15}6 \\[5pt] \frac{0.15}6 & \frac{0.15}6 & \frac{0.15}6 & 0.85\!+\!\frac{0.15}6 & \frac{0.15}6 & \frac{0.15}6 \end{bmatrix} \]

這是一個不可約馬氏鏈, 它有唯一平穩分佈。 Google把馬氏鏈的平穩分佈稱作PageRank, 並以此來為頁面重要性排序。 一個頁面的PageRank值越高, 即平穩分佈在一個頁面的值越大, 就認為這個頁面越重要。 在數學上可以嚴格證明, 平穩分佈在一個頁面的值正好等於點擊這個頁面的平均造訪率, 所以用這個值來為頁面的重要性排序很合理。 不可約馬氏鏈的平穩分佈在電腦上運用反覆運算法容易實現。但由於互聯網的規模很大, 實際計算時也需要很長時間。 這種計算頁面重要性的演算法出自 1998 年就讀史丹佛大學 (Stanford University) 的博士研究生 Sergey Brin 與 Larry Page, 他們把這個演算法稱作 PageRank 演算法, 並且編寫了一個 PageRank 搜尋工具。 他們發現, 網路越大, 連結越多, 這個引擎提供的結果就越準確。 於是, 他們將新引擎命名為 Google, 這是 Googol 的變體, Googol 是一個數字名詞, 表示 10 的 100 次方。 Brin 與 Page 於 1998 年在第七次國際 World Wide Web 會議 (WWW98) 上公佈他們的論文 ``The Page Rank citation ranking:Bringing order to the Web" 時, 正在用自己的宿舍作為辦公室初創產業, 這一產業後來發展為龐大的 Google 公司, Brin 和 Page 現在已躋身世界上最有錢的人之列。 PageRank 演算法是資訊檢索領域裡一個革命性的發現, 這個在資訊檢索領域看似很困難的問題, 用一個巧妙的數學方法就解決了, 數學的用處有時真是不可估量。 在介紹 PageRank 演算法時, 還應提到另外一位學者 Jon Kleinberg。 1998 年時他是康乃爾大學的助教。 幾乎與 Brin 和 Page 同時, Kleinberg 提出了一個與 PageRank 演算法類似的 HITS (Hypertext Induced Topic Selection) 演算法。 而 Kleinberg 本人並沒有涉足企業或商界, 他迄今仍活躍在學術領域中, 他在 2006 年獲得國際數學聯盟頒發的 Nevanlinna Prize。 我還要補充強調一下, 現在各搜尋引擎公司對頁面的排序, 除了用到 PageRank 演算法, 或類似於 PageRank 演算法提供的重要性排序外, 還要考慮相關性排序和諸多其它因素。

馬氏過程與上網行為分析

從 1998 年到現在, Google 的 PageRank 演算法作為網頁排序的優點已經充分顯示, 而缺點也逐漸地暴露出來, 最大的缺點是它只利用了頁面結構, 沒有考慮網路使用者的感情。 其實現在有很多的垃圾頁面, 它的 PageRank 可以排得很高。 甚至有些 SPAM 公司, 自已搞個伺服器, 讓許多頁面互相連結, 如果對方給錢, 公司就將你的頁面連結上去, 從而惡意提高頁面排序。 這個問題, 特別是在前幾年, 成為搜尋引擎公司非常關注的問題, 怎麼樣能夠克服這個缺點, 當時很多搜尋引擎公司都在做。 我們跟微軟亞洲研究院在這個問題上也有些合作的關係。 當時是這樣開始的, 記得大概是 2005 年吧, 我那時候對隨機複雜網路感興趣, 辦了一個隨機複雜網路的討論班。 微軟亞洲研究院的一位年輕工作人員來找我, 「馬老師你們在做隨機網路, 我有些問題想請教你們」。 我藉此請他在我們討論班作報告, 他向我們介紹了 Google 的故事。 以後我們跟微軟亞洲研究院開始合作, 我的學生也到微軟實習生, 共同培養人才。 有一次, 一位年輕的研究員和我的學生一起來找我, 把使用者上網紀錄數據拿給我看, 問我由這些數據, 能不能夠判斷出頁面的重要性, 或著說能不能挖掘出什麼樣的訊息來。 實際上所有的搜尋引擎公司都蒐集這些訊息, 這個訊息不包含你的私人秘密, 客戶使用他們的軟體, 要簽一個用戶協議, 同意他們蒐集這個訊息, 裡面不包含私人的訊息, 是為了科研用的。微軟把這訊息拿來, 我們坐下來開始想這個能做什麼用。 當然我們是學機率的, 所以我們就想到這是個隨機過程, 肯定是隨機過程, 因為它不是決定性的, 那它當然是跳過程, 一跳一跳的。 我們猜想其中比較關鍵的是, 在這個頁面上你下一步到哪個頁面去, 或者你在這個頁面上停留多少時間, 這些在很大程度上, 只跟頁面的內容有關, 而跟你以前造訪過哪些頁面無關, 因此作為一階近似, 這個過程很可能是一個馬氏過程, 它將來的發展只與現在有關, 跟過去無關。 另一個猜想, 你上午看這個頁面或下午看這個頁面, 你的動作可能差不多, 所以還應該是時間齊次的。 所以當時我們就分析, 也許可以把所有人群上網的動作, 近似的看作是一個時間齊次的馬氏跳過程。 當然囉, 要判斷它是不是時間齊次馬氏跳過程, 要用到一些數學知識, 假如真的是時間齊次馬氏過程, 那麼用戶在一個頁面停留的時間, 應該是負指數分佈, 這是學馬氏過程所知道的。

我們建議微軟把他們的數據拿來檢驗一下, 於是微軟亞洲研究院的相關研究組用真實資料作了大量實驗類比, 由劉玉婷設計演算法, 發現使用者在網頁的停留時間基本服從負指數分佈。 只是前面有一兩秒與負指數分佈不符, 這也是正常的, 因為一開始你還沒有閱讀頁面, 電腦打開的時候還要有一段時間, 頁面打開也有一段時間, 你的眼睛適應要一點時間, 再者是版面設計很複雜, 所以一開始並不是馬氏過程, 一開始是噪音, 真正的過程應該是馬氏過程再加上噪音。 這個分析出來之後, 我們相信可以用馬氏過程來研究上網動作, 微軟亞洲研究院成立了一個小組主攻這個項目, 我的學生劉玉婷當時作為微軟的實習生也在這個研究小組。 這個研究小組做得非常好, 都是他們在做, 在微軟相關研究員的帶領下, 他們克服了種種難關, 每一步都在課題組內反覆論證, 深入探討, 反覆模擬實驗。 這裡面含有許多奇思構想和巧妙的數學。

微軟亞洲研究院從產品部門調來大量資料, 做了大規模類比實驗。

2008 年 7 月, 在新加坡召開的的第 31 屆國際資訊檢索大會上, 劉玉婷報告了他們的論文: 《流覽排序:讓網際網路使用者為頁面重要性投票》, 論文獲得了會議設立的唯一最佳學生論文獎。 這篇文章, 據說他們修改了八十一次, 在新加坡得獎之後, ``Browse Rank" 成了業內的熱門話題。 最熱的時候, 輸入關鍵字 Browse Rank 有 157,000,000 個結果。 當時網頁的文章, 有的題目是 ``Browse Rank vs Page Rank", 有的說 ``Microsoft Lauches Browse Rank To Compete With Page Rank", 還有 ``Live Search is researching a ranking feature similar to Google's Page Rank called Browse Rank", 等等。 網上還有一個以``Browe Rank the next PageRank" 為題目的視頻介紹微軟亞洲的研究人員開發的 Browse Rank。 這是前幾年的事, 當然了, 一個新產品的開發還與許多其它因素有關, 現在也沒有 Browse Rank 出現, 但是說明當時這個工作在訊息檢索領域引起了一些關注。 我們與微軟現在還有合作, 現在我還有學生在微軟, 已經是正式的員工。

從做科學研究的角度來說, 我們感到高興的是我們第一個用 Browsing Process 刻畫了真實的用戶上網行為。 我相信今後人們在研究用戶上網行為時, 一定會想到 Browsing Process, 應用並發展 Browsing Process 的理論和實踐。 上面說到我們發現用戶上網的一階近似可以用馬氏過程來刻畫, 後來我們又有進一步發揮, 在這個基礎上提出了 web 馬氏骨架過程, \[ X_0 \xrightarrow{Y_0} X_1 \xrightarrow{Y_1} \cdots X_n \xrightarrow{Y_n} \cdots \] \[ \begin{array}{ll} \{ X_n,n\geq0 \} & \mbox{Markov Chain} \\ \{ Y_n,n\geq0 \} & \mbox{conditionally independent given} \{ X_n. \} \end{array} \] 之所以提出web馬氏骨架過程, 是因為後來研究手機網的搜尋引擎時, 發現它不完全是馬氏過程, 最多可以算是 web 馬氏骨架過程, 也就是說它有一個骨架是馬氏的, 而它的等待時間不僅依賴當前頁面, 還依賴以前的頁面。 由於手機上面網頁的超連結, 跟一般普通網頁超級連接的設計不一樣。

數學與現代經濟金融

剛才說到訊息領域, 現在來說金融經濟跟數學的密切相關。這裡有一個最好的例子, 2012 年的諾貝爾經濟學獎頒給 Roth 和 Shapley。 Shapley 得了經濟學獎, 但他說自己不是學經濟的, 一直把自己當作數學家, 從來沒上過一堂經濟學的課。 當然他之所以得經濟學獎, 是因為他做的數學, 經濟學家感到很好用, 而且不僅是經濟學家, 我們在日常生活中都會覺得很好用。 現在講一個可以用到日常生活中的例子, 這個例子和我們大陸江蘇衛視的非誠勿擾節目似乎有點關聯。 非誠勿擾節目中有兩隊, 一隊男、一隊女, 男的向女的示愛, 女的接受, 也可能不接受, 然後一次一次做下去。如果用 Gale-Shapley 演算法來編排這個節目, 我們可以假定每個人對所有的異性有一個排序, 這個排序假定是全序的, 就是你不會模稜兩可, 肯定是一個比一個好或是一個比一個壞, 然後每一個男生向他們最喜歡的女生表白, 收到表白的女生就可以找一個你最喜歡的人, 表示你同意了, 其他的人你就拒絕, 當然也可以不要, 一個都不要也可以的。 配對不成功的男生繼續在沒有拒絕過他的女生當中挑出他最喜歡的一個, 你挑出最喜歡的這個女生, 有可能已經配對了, 有可能還沒有配對, 如果她已經配對, 她要接受你的話必須拒絕掉前面的那一個朋友, 如果她沒有配對當然可以接受你, 這樣一輪一輪地做下去, 直到沒有新的表白出現。 根據 Gale-Shapley 的理論, 這個過程一定會終止, 並且每個人都會找到自己的理想伴侶, 更重要的是, 如果是用這一個過程來結成良緣, 這個婚姻一定是穩定的, 意思就是一定不會存在兩個人雖然不是一對, 但是彼此都覺得對方比現在的伴侶要好的情況, 所以這個婚姻是穩定的。

說起來這就是我們日常生活當中的事, 但是數學家可以把它抽象為一個數學定理, 而且從數學上給出證明。 當然 Shapley 得諾貝爾經濟學獎還有很多其它的工作, 他在 game theory 裡面有很多工作, 包括組成團隊怎麼樣才有權力能夠決定事情等等, Shapley 的工作提供了數學現在已經滲透到經濟金融, 而且滲透到我們日常生活當中的生動例子。

{伊藤公式和伊藤清8 8 ō Kiyoshi (1915$\sim$2008) 在隨機積分與隨機微分方程的先驅工作, 發展成現在所謂的 ō Calculus 或隨機分析。 ō School 對機率的發展有重大深遠的影響。}

如果要談數學與經濟金融的關係, 必不可少地要談 Black-Scholes 的資產定價公式, 這裡面用到最重要的數學就是伊藤公式。 有很多即便是學數學但不是學機率的, 弄不清楚伊藤公式是什麼。伊藤公式實際上就是牛頓萊布尼茲公式 (微積分基本定理) 的一個推廣。 比如說我們要計算函數值 $f(t)-f(0)$, 可以對$f$求導數再從$0$到$t$取積分。更一般如果你計算複合函數值 $f(x_t)-f(x_0)$, 可以對 $f$ 取導數再套上 $x_s$, 然後用 $dx_s$ 從 $0$ 到 $t$ 積分。 這是微積分的一個基本公式, 這個公式的關鍵是有一個求和的極限, 無限細分求和再取極限。 如果是 $dx$, 則很簡單, 你用無限細分求和加起來取極限即可。 如果是$dx_s$, 那麼就有個條件, 就是無限細分之後這些差分的絕對值加起來應該小於無窮, 這相當於這個曲線是可求長的。 如果曲線是可求長的, 你用泰勒展開可以看出 2 階及以後的項都是高階無窮小, 取極限後只留下一階項, 就可以得到這個微積分公式。 當然有些曲線是不可求長的, 比如說股票的價格波動曲線, 這個曲線就不可求長, 跟布朗運動的曲線幾乎類似, 就是任何一小段無限細分之後把差分絕對值加起來的極限都等於無窮。 對這種不可求長的曲線, 牛頓萊布尼茲公式就不好用了, 因為不滿足前面說的條件。 伊藤的貢獻就是發現了雖然它的差分絕對值加起來的極限等於無窮, 但是無限細分之後這個 $\Delta x_i$ 的平方加起來取極限是有限的, 對於布朗運動正好等於 $t-s$, \[ \lim_{ \max_i | \Delta X_i | \to 0 } \sum_{i=0}^{n-1} ( \Delta X_i )^2 = t-s. \] 對於擴散過程來說可能是另外的值, 但總是有限的, 當然是在某種機率意義下的極限。 伊藤發現, 如果無限細分後平方和的極限有窮, 要算 $f(x_t)-f(x_0)$ 可以對泰勒展開多展一項, 展出一個 $\Delta x_{t_i}$ 的平方項, 後面是 $\Delta x_{t_i}$ 平方的高階無窮小項, \[ f(X_{t_{i+1}}) - f(X_{t_i}) = f'(X_{t_i}) \Delta X_{t_i} + \frac{1}{2} f''(X_{t_i}) ( \Delta X_{t_i} )^2 + o(| \Delta X_{t_i} |^2), \] 用這個泰勒展開無限細分再求極限就得到了伊藤公式, \[ f(X_t) -f(X_0) = \int_0^t f'(X_s) dX_s + \int_0^t \frac{1}{2} f''(X_s) ds. \] 所以伊藤公式其實沒那麼神秘, 伊藤公式就是微積分公式的推廣, 只不過是泰勒展開多展一項。 對 $\Delta x_{t_i}$ 的平方無限細分求和的極限是 $t-s$, 所以就是 $ds$ 的積分。 泰勒展開的二階項有係數 1/2, 所以伊藤公式的第二項有係數 1/2。 伊藤公式應用廣泛, 用伊藤公式可以推導前面提到的 Black-Scholes 公式, 資產訂價理論的很多公式都可以用伊藤公式來計算。 伊藤公式後來發展為隨機分析, 數學家們能夠用隨機分析來研究各種隨機的現象。 伊藤清的理論用到經濟金融, 用到生物學, 物理學和其它領域, 在技術、商業、日常生活當中都產生了非常重要的影響。 因為影響甚鉅, 他在 2006 年馬德里世界數學家大會獲頒首屆高斯獎。 頒獎之後他的女兒代唸了伊藤自己寫的獲獎感言, 其中有這麼一段話: 「我自己關於隨機分析的研究是純數學的, 因此把應用數學的高斯獎頒發給我的確是出乎意外, 我深深地感謝。」 這裡我們再一次體會到純粹數學和應用數學是沒有明確界限的。

伊藤的故事很精彩, 他的父親是教日本文學和漢語文學的中學教員, 伊藤本人最早就讀於東京大學數學系, 大學畢業之後並沒有立刻在大學裏面教書, 而是在東京的政府統計局做小職員, 直到 1943 年進入日本名古屋大學作副教授。 他最初兩篇論文都是 1942 年在統計局做小職員時發表。 第一篇是關於 Lévy 過程的分解, 就是現在隨機分析教科書上經典的 Lévy-ō 分解, 是他的第一個結果。 Lévy 研究這個分解, 是從純分析的方法出發, 伊藤是從軌道的角度出發, 他發現 Lévy 過程的軌道可以分解為擴散部分、跳部分和飄移。 Lévy 過程按照軌道的分解是伊藤的功勞。

第二篇論文, 發表於大阪大學發行的油印手寫版的日文雜誌, 就是利用鋼筆刻的那種, 發表在那上面, 而這篇論文就包含著名的伊藤公式。 二戰結束若干年以後, ō 把他 42 年的文章擴展並譯成英文, 送到美國請 Doob 幫忙發表, Doob 立刻意識到文章的重要性, 並安排在 1951 年的 Mem. Amer. Math. Soc 發表, 文章的題目為 On Stochastic Differential Equations。 從 1952 年起伊藤成為京都大學教授, 從 1954 到 1956 他在普林斯頓高等研究所作 Fellow, 他也分別在史丹佛大學 (1961$\sim$1964年), 奧爾胡斯 (Aarhus) 大學 (1966$\sim$1969) 和康奈爾大學 (1969$\sim$1975年) 擔任教授。 在此期間伊藤往來於日本和美國, 多位參加他在京都大學舉辦的討論班的年輕人後來都成為有名的隨機分析專家, 其中包括他的學生 Watanabe9 9 Watanabe Shinzo (1935$\sim$) 日本數學家, 在隨機分析、 鞅論等機率領域有根本的重要貢獻。, Kunita10 10 Kunita Hiroshi (1937$\sim$)日本數學家,研究領域為隨機分析與數理金融,在這些領域有重要的貢獻。, Fukushima11 11 Fukuhsima Masatoshi (1935$\sim$)大阪大學榮譽教授, 在狄氏型、 馬氏過程上的根本工作影響深遠。,

這三人是真正在伊藤名下註冊的研究生, 還有 N. Ikeda, M. Motoo, T. Hida, M. Nisio, H. Tanaka和其他知名學者。

聽說伊藤1987年曾訪問中央研究院, 伊藤 1981 年到北京訪問中國科學院時, 我還是應用數學所的研究生。 訪問完他非常高興, 回日本後他為我聯繫了日本振興會的獎學金, 推薦我到京都大學去念博士。 我當時非常高興, 但後來因故沒去成, 去了也許我的人生軌跡就不一樣了。 雖然去日本念書我是擦肩而過, 沒有做成京都大學的博士, 但是我受到伊藤的學生的幫助, 受到 Fukushima 的幫助, 我非常感激。 我剛才說了, Fukushima 是伊藤註冊的博士生, Fukushima 對隨機分析有很重要的貢獻, 是他最先從正則狄氏形構造出 Hunt 過程 (一類很好的過程), 把隨機分析和經典的位勢理論建立起連繫, 那是 1971 年的事, 是突破性的貢獻。 由於 Fukushima 的工作, 使得現代狄氏型的理論和應用發展得非常快, 現在還是非常活躍的領域。

當然 Fukushima 還有許多其它的重要工作。 自從 1971 年 Fukushima 找到正則狄氏形與 Hunt 過程的聯繫之後, 就有人想找一找狄氏形聯繫 Hunt 過程的充分必要條件, 或者能不能把 Fukushima 的理論用到無窮維, 能夠更一般些, 因為正則狄氏型要求空間一定是局部緊, 也就只能是有限維。 我那時沒去成日本, 在中國科學院獲博士學位後申請到洪堡(Humbolt), 用洪堡獎學金到德國留學。 去德國之前, 根據嚴加安12 12 嚴加安 (1941$\sim$) 中國機率統計學家, 任教中科院應用數學研究所, 為中國科學院院士。教授的建議我們在北京組織了一個討論班, 專門討論 Fukushima 關於狄氏型和對稱馬氏過程的書。 1986 年底到德國 Bielefeld, 正好 BiBoS 隨機中心的許多科學家都在研究狄氏型及其應用, 特別是我的老闆 Albeverio13 13 Sergio Albeverio, 任教德國波昂大學, 研究領域為機率、 分析以及數學物理。和他的學生 Roeckner14 14 Michael Roeckner, 任教德國 Bielefeld 大學,研究領域為機率、 分析以及數學物理。, 他們在無窮維狄氏型的研究方向做得很出色。 因此我比較幸運, 我們合作在 90 年代初找到了狄氏型聯繫好的馬氏過程的一個充分必要條件。 Fukushima 對年輕人非常提攜, 記得當初我們做出這個工作之後, 寫信告訴 Fukushima, Fukushima 看到我的信之後, 都沒來得及寫信, 直接打電報給我, 說你們這個定理一定是將來研究馬氏過程的一個主要參考文獻, 建議我們盡快發表。 根據 Fukushima 的建議, 我們把這個狄氏型叫做 quasi-regular Dirichlet form, 從正則推廣為擬正則。 Fukushima 還推薦並幫我獲得資助參加 1990 年在京都的世界數學家大會, 那是我第一次參加世界數學家大會。 由於這項合作工作和其它工作, Albeverio、 Roeckner 和我獲得了 Max-Planck 獎, Roeckner 和我合寫了一本系統研究擬正則狄氏型的書在 Springer 發表, 1994 年我在國際數學家大會的報告也是這個題目。 擬正則狄氏型以及我們和陳振慶合作關於擬正則狄氏型與正則狄氏型擬同胚的工作, 有許多應用。 現在回想起來, 我雖然沒有如伊藤所推薦到京都大學學習, 但是伊藤的學生 Fukushima 對我幫助非常大。 那是90年代初的事, 值得一提的是到了 20 年之後, 2011 年 Fukushima 和陳振慶15 15 Zhen-Qing Chen, 美國University of Washington 教授, 研究領域為機率與隨機分析。合寫的書16 16 Chen, Z. and Fukushima, M. : Symmetric Markov Processes, Time Change, and Boundary Theory (LMS-35), Princeton University Press, 2011, 512pp., 第一章用了三節來討論擬正則狄氏型和擬同坯, 而且在前言中就說用擬同坯方法可以把擬正則狄氏型和對稱馬氏過程的問題轉化為正則狄氏型的問題來研究。 所以這真是印證了 Fukushima 當時在電報中對我們工作的判斷, 這也讓我想起我們機率統計界一位老前輩許寶騄大師的一句話, 他說: 「一篇文章的價值不是在它發表的時候得到了承認, 而是在後來不斷被人引用的時候才得到證實。」

數學與現代生命科學

後面我還有些內容是講數學與現代生命科學, 但是我時間已經用的差不多了, 也許我用幾句話來講講數學跟現代生命科學之間的關係。 在現代生命科學中, DNA 結構的發現無疑是劃時代的成就。 DNA 是由兩條線狀的大分子鏈組成的雙螺旋, DNA 雙螺旋的每條鏈由四種小分子連接而成, 而四種小分子 (鹼基:A,T,C,G) 的排列組合構成了生命的遺傳信息。 因此 DNA 作為生命的資訊庫和程式庫, 它是一套可以自行複製並且可以不斷發展進化的程式, 生命就是一個天然且非常複雜的電腦。 在通常數學中我們用十進制, 在訊息和電腦領域用二進制, 而生物則是四進制, 所有這些 DNA 可以看成 ATCG 四個字所組成的四進制編碼。 有人曾經誇張地說, 如果你去看生物雜誌, 除了專業不同之外, 分子生物學雜誌裡面的每一頁都可以換成計算機技術雜誌的內容。 一方面, 生物是按照數學方式設計的, 另一方面, 生命可也以用數學的手段進行研究。 特別是隨著現代高科技的發展, DNA 資料的快速積累, 現代生命科學的研究已經離不開與數學、統計、計算等其它學科的交叉, 並因此而產生了一些新興的交叉學科, 如生物資訊學、計算生物學、生物數學等。 最近我們與生物科學家合作, 在數學與生命科學交叉的領域也作出一些研究成果, 由於時間的關係, 我就不在這方面詳述了。 今天的演講到此為止。 謝謝大家。

--- 整理者李竺祈曾任本所助理---