37403 組合、代數及分析中可用機率解決的有趣問題

終極密碼

遊戲規則:本遊戲為猜密碼的遊戲。密碼為0到100之間的其中1個整數,電腦會提示密碼的所在範圍,玩家必須在6次之內猜到密碼才能過關。
★ 終極密碼為0到100之間 ★
您共有六次機會


演講者: Jordan Stoyanov 教授
              (英國新堡大學)
E-mail: stoyanovj@gmail.com
時間: 民國 101 年 12 月 24 日
地點: 天文數學館 202室
整理: 陳麗伍

1. 引言

這是關於數字、函數、積分等等的演講, 這些簡單的概念, 大部分的人都不陌生。 我們用的符號都是通用的符號, 例如 ${\mathbb N}$ 是正整數的集合, ${\mathbb R} \!=\!(-\infty, \infty)$ 代表所有的實數所成的集合等。

用機率去解決不同數學領域的問題是這個演講的目的之一。 並不是所有的問題都可以用機率來解決。 但是如果可以的話, 通常這些方法比較簡短、易懂、並且吸引人。 事實上, 到目前為止還有一些很深奧、重要的結果只能用機率的方法來證明。

接下來我們會用到一些簡單的機率術語, 像隨機變數、隨機事件、機率、機率分布函數、密度函數、動差(moment)及古典的大數法則(Law of Large Numbers, LLN). 下面是一些特別的概念。

離散均勻分布: 隨機變數 (r.v.) $X \sim U_n$. $X$ 取值在正整數集合 $\{1,2,\ldots,n\}$, 或者是任何 $n$ 個實數所成的集合。 每一個數取到的機率是 $\frac{1}{n}$。 例如,

丟對稱銅板: 兩個結果正或是反, 出現的機率各是 $\frac{1}{2}$.

擲對稱骰子: 有六種出現的可能 : $1, 2, 3, 4, 5, 6$, 每一種出現的機率都是 $\frac{1}{6}$.

在 $(0,1)$ 上的連續均勻分布: $X \sim U(0,1).$ 當 $x \in (0,1),$ 其密度函數 $f(x)=1;$ 若 $x \notin (0,1),$ 則 $f(x)=0$. $U(0,1) = \beta (1,1)$. $\beta (a,b)$ 的定義如下:

Beta 分布: $X \sim \beta (a,b)$, $a\gt 0, \ b\gt 0$. $X$ 是一個連續隨機變數, 它的密度函數是 $$ f(x)=\left\{\begin{array}{lcl} \dfrac{x^{a-1}(1-x)^{b-1}}{B(a,b)}, &\quad~&\mbox{ 若 } \ x \in (0,1); \\ 0, &&\mbox{ 若 } \ x \notin (0,1).\end{array}\right. $$

$ B(a,b)$ 和 $\Gamma (a)$ 是尤拉的 $\beta$ 函數(貝塔函數)和 $\gamma$ 函數(伽瑪函數): $$B(a,b)=\frac{\Gamma (a) \Gamma (b)}{\Gamma (a+b)}, \qquad \Gamma (a)=\int_0^{\infty} x^{a-1}e^{-x}dx, \qquad \Gamma (n+1)=n!.$$

2. 組合等式

證明對於任何的整數 $n$ 與 $k$ ($1 \leq k \leq n$), 下述結果是正確的: $$ \binom{n}{k}\sum_{j=0}^k (-1)^{k-j} \frac{n+1}{n+1-j} \binom{k}{j} =1. {(*)} $$

證明: 這個恆等式第一眼看上去覺得很簡單, 讀者可以試著自己證明。 證明的想法用到連續分布的密度函數其積分值是 1, 以及在離散的情況, 其機率的和是 1。讓我們明確地寫下來:

  • 密度函數 $f(x)$, $x \in I \ \Longleftrightarrow \ f \geq 0$, $\int_I f(x)dx=1$ $(I \subset {\mathbb R}^1,$ 為有限或無限區間)。
  • 離散分布在一個可數的集合 $I_d$ 上, $\{p_j\gt 0, \ j \in I_d \} \ \Longleftrightarrow \ \sum_{j \in I_d} p_j = 1$。

考慮隨機變數 $X \sim \beta (n-k+1, k+1)$。它的密度函數如下: $$ f(x)=\frac{x^{n-k}(1-x)^{k}}{B(n-k+1,k+1)}, \qquad x \in (0,1). $$

由牛頓的二項式定理展開 $(1-x)^k$, 利用 $\Gamma (n+1)=n!$, 得出 \begin{eqnarray*} 1&=&\int_0^1 f(x) dx= \frac{\Gamma (n+2)}{\Gamma (n-k+1) \Gamma (k+1)}\int_0^1 x^{n-k}(1-x)^kdx \\ &=&\frac{\Gamma (n+2)}{\Gamma (n-k+1) \Gamma (k+1)}\int_0^1 x^{n-k}\sum_{j=0}^k \binom{k}{j}(-1)^{k-j}x^{k-j}dx\\ &=& \frac{\Gamma (n+2)}{\Gamma (n-k+1) \Gamma (k+1)} \sum_{j=0}^k \binom{k}{j}(-1)^{k-j}\int_0^1 x^{n-j}dx\\ &=& \frac{(n+1)!}{(n-k)!\,k!}\sum_{j=0}^k (-1)^{k-j}\binom{k}{j}\frac{1}{n-j+1} = (*). \end{eqnarray*}

練習1:用不同的方法證明等式 $(*)$。

3. 一雙骰子的實驗, 公平嗎?

假設我們有兩個不同的公平(fair)骰子, 一紅一藍。骰子每一面上分別標示 1, 2, 3, 4, 5, 6, 它們出現的機率各是 $\frac{1}{6}$. 丟這兩個骰子, 以 $X_1$ 與 $X_2$ 分別代表兩個骰子朝上一面的數字。我們有興趣的是這兩個數字的和 $S_2= X_1+X_2$. 不難看出 $S_2$ 的值與其出現的機率如下: $$\begin{array}{lllllllllll} ~2, &~3, &~4, &~5, & ~6, & ~7, & ~8, & ~9, & 10, & 11,& 12\\ \frac{1}{36}\, , & \frac{2}{36}\, , & \frac{3}{36}\, , & \frac{4}{36}\, , & \frac{5}{36}\, , & \frac{6}{36}\, , & \frac{5}{36}\, , & \frac{4}{36}\, , & \frac{3}{36}\, , & \frac{2}{36}\, , & \frac{1}{36}\end{array}{(**)}$$

現在問一個反過來的問題: 假設有兩個骰子, 擲了好多次以後, 發現它們的和 $S_2$ 是 2 到 12 之間的整數, 出現的機率正好與 $(**)$ 一樣。 這一雙骰子一定是公平的嗎?

正確的答案是: 不一定。 原因如下, 考慮兩個特別的情況:

情況 1: 一雙骰子 $A$、$B$, "正常的" 六面, 每面出現的機率是 $\frac{1}{6}$, 如果將骰子每面的標示改為以下的形式:

骰子 $A$: 1, 2, 2, 3, 3, 4. 骰子 $B$: 1, 3, 4, 5, 6, 8,.

丟 $A$ 與 $B$, 得到 $X_1$ 與 $X_2$, 計算其和 $S_2=X_1+X_2$.

練習 2: 證明 $S_2$ 的值在 2 到 12 之間出現的可能性與 $(**)$ 一樣。 (顯然這兩個 "特別的" 骰子都不是公平的。)

情況 2: 兩個不同的物件, 一個是四面體的骰子, 另一個是轉盤。

四面體骰子:四面體的四個面分別寫上 1, 1, 4, 4, 每一面出現的機率是 $\frac{1}{4} $.

轉盤:有 18 個相等扇形區域的格子, 分別用以下數字標明:

$1, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5, 6, 6, 6, 7, 7, 8$ 每格出現的機率是 $\frac{1}{18} $.

注意, 四面體骰子 "等同" 有兩個結果的硬幣, 1 和 4, 每個出現的機率是 $\frac12$. 轉盤 "等同" 在一個箱子中放了18 顆球:一顆球標上 "1", 兩顆球標上 "2", 三顆球標上 "3", 三顆球標上 "4", 三顆球標上 "5", 三顆球標上 "6", 二顆球標上 "7", 一顆球標上 "8"。 每顆球被抽到的機率是 $\frac{1}{18}$, 可以很容易把抽到 1 號到 8 號球的機率寫出來。

現在做個實驗, 針對這兩個不同的物件, 記錄其結果:

$X_1$ = 丟四面體骰子所得到的數字 (硬幣測試),

$X_2$ = 轉動轉盤所得到的數字 (球上所標的號碼)。

練習 3:證明 $S_2=X_1+X_2$ 的值是 2 到 12 間的整數, 其出現的機率與 $(**)$ 的機率一模一樣。由此可得出什麼結論?

4. 樂透, 百萬大獎到你家

賭場中有一種骰子的遊戲。每顆都是公平的骰子, 六面分別寫上數字 1, 2, 3, 4, 5, 6, 每個數字出現的機率是 $ \frac{1}{6}$.

遊戲規則: 你可以選擇用 $n$ 個骰子來玩,

$$n=1, 2, 3, 4, {\bf 5}, 6, 7, 8, 9, {\bf 10}, 11, 12, 13, 14, {\bf 15}, 16, 17, 18, 19, {\bf 20}$$.

丟 $n$ 個骰子, 以 $X_1, \ X_2, \ldots, X_n$ 來記錄得到的點數。 找出其和 {$S_n$} 與其乘積 {$P_n$} : $$S_n=X_1+ \cdots + X_n,~~ \ \ P_n= X_1 \cdots X_n. $$

如果 $$S_n=P_n$$ 就贏了, 贏的多少取決於投擲骰子的個數。

如果用 $n$ ($=1, 2, 3, 4, 6, 7, 8, 9, 11,\ldots, 19$) 個骰子玩這個遊戲, 需要付出 $\$ n$ 的籌碼, 若 $S_n=P_n$ 則會贏得 $ \$\,n^3$ 的籌碼。 如果用 ${\bf n}$ ($= {\bf 5, 10,15, 20}$) 個骰子玩這個遊戲, 需要付出的籌碼和可以贏到的籌碼如下:

${\bf{n=5}}$, 付 $100, 贏 $100,000;
$\bf{n=10}$, 付 $200, 贏 $200,000;
$\bf{n=15}$, 付 $1,000, 贏 $1,000,000;
$\bf{n=20}$, 付 $2,000, 贏 $2,000,000。

問題:5, 10, 1520 有什麼特別?

問題重組: 令集合 $A=\{1, 2, 3, 4, 5, 6 \}$ 且 $n \in {\mathbb N}$。 若 $x_1, \ldots$, $x_n$ 是由 $A$ 隨機獨立地挑出, 這些數字可能會重複, 試解以下的丟番圖不定方程式 (Diophantine equation): $$ x_1+ \cdots + x_n = x_1 \cdots x_n. {(***)} $$

解釋: 如果方程式 $(***)$ 有解, 贏的機率是正的, 並以 $W_n={\bf P}[S_n=P_n]$ 表示, 也就是有機會贏到金額 $ \$\,n^3$ 或更多。 如果方程式 $(***)$ 無解, 贏得遊戲的機率是 $W_n=0$。 下面列出 $n$ 從 1 到 5 的情形:

情況 1: $n=1 \Rightarrow$ trivial, $W_1=1$.

情況 2: $n=2 \Rightarrow (2,2) \Rightarrow W_2=\frac{2!}{2!}\,\frac{1}{6^2}$.

情況 3: $n=3 \Rightarrow (1,2,3) \Rightarrow W_3=\frac{3!}{1!1!1!}\,\frac{1}{6^3}$.

情況 4: $n=4 \Rightarrow (1,1,2,4) \Rightarrow W_4=\frac{4!}{2!1!1!}\,\frac{1}{6^4}$.

情況 5: ${\bf n=5} \Rightarrow (1,1,1,2,5), (1,1,1,3,3)$ 及 $(1,1,2,2,2) $
$ \Rightarrow W_5=\left(\frac{5!}{3!1!1!} + \frac{5!}{3!2!} + \frac{5!}{2!3!}\right)\,\frac{1}{6^5}$.

練習 4: 找出當 $n=6, 7, \ldots, 20$ 時方程式 $(***)$ 的解。

你會發現 $W_n \gt 0$, 當 $n=6, 7, \ldots, 14,$ 包含 $\bf{n=10}$. 事實上在情況 $\bf{n=10}$, 方程式 $(***)$ 之解為八個 $1$ 和兩個 $4$ (和與乘積均為 $16$), 而 $W_{10}=\frac{10!}{8!2!}\,\frac{1}{6^{10}}$, 機率很小但是正的。 你可試著處理情況 $n=11,12,13,14$, 會有意想不到的結果。

出乎意料的結果: 當 $\bf{n=15}$, 方程式 $(***)$ 沒有解! 所以贏的機率是 $W_{15}=0$, 也就是用 15 顆骰子玩這個遊戲一定輸。

接下來: 當 $n=$ 16, 17, 18, 19, $W_n\gt 0$, 不過當 $\bf{n=20}$, 贏的機率又是 $W_{20}=0$, 也就是用 20 顆骰子玩這個遊戲根本沒有機會贏。

問題: 如果賭場可以讓賭客用 20 個以上的骰子玩這個遊戲, 會發生甚麼情況? 試解當 $n\gt 20$ 的不定方程式 $(***)$.

有趣的是, 很容易就可以發現 $W_{21}\gt 0, \ W_{22}=0, \ W_{23}\gt 0, \ W_{24}=0$, 而 $\ W_{n}\gt 0$, $n=25, \ldots, 30$。當 $n=31$ 時, 又得到 $W_{31}=0$ 等。

註: 方程式 $(***)$ 無解的 $n$ 值出現的並不規律。 後面無解的情況會出現在 $n=$34, 35, 36, 38, 43, 44, 46, 48, 49, 並且還有更多。

猜想: 有無限多個 $n$ 使得方程式 $(***)$ 無解。

問題: 我們發現 $W_5\gt 0, \ W_{10}\gt 0, \ W_{15}=0, \ W_{20}=0$. 賭場因此將 $\bf 15$ 和 $\bf 20$ 用特殊的粗體字表示是很明顯的, 自然而然地會問: 為什麼 ${\bf 5}$ 和 ${\bf 10}$ 也要用粗體字表示?

答案:有兩種可能:

  • 我們設想從賭場或莊家的立場, 這是特別用來誤導或吸引過客加入賭局的方法。
  • 重要的是:當從不同的集合 $A$ 取值 $x_j$ 時, 不定方程式 $(***)$ 會演化成各種新的、有趣的但不易解決的問題。 雖然有些問題已經解決, 但還有更多問題等待完成。

5. 連續函數的多項式逼近

讓我們由一個經典的結果開始。

Weierstrass 定理 (1885)}1 1 延伸閱讀: 「Weierstrass逼近定理」, 數學傳播第22卷第3期;「複分析五講:第三講 --- Weierstrass 級數理論」, 數學傳播第34卷第4期。 : 任意定義在有界閉區間 $[a, b]$ 的連續函數 $f$, 都可以用多項式 $P_n$ 來均勻地逼近。

注意, 這是一個描述性的結果(a qualitative result), 並沒有指出如何建構用來逼近 $f$ 的多項式。下一個結果更實用。

Bernstein 定理 (1912): 令 $f(x)$, $x \in [0,1],$ 是一個連續函數。 定義 Bernstein多項式如下: $$ B_n(x)=\sum_{k=0}^{n} f\left(\frac{k}{n}\right) \binom{n}{k} x^k (1-x)^{n-k}, \ x \in [0,1], \ n=1,2,\ldots. $$ 當 $n \to \infty$, $B_n(x)$ (在 $\sup$ norm 之下)會均勻地收斂到 $f(x),~x\in [0,1]$.

證明的想法: S. N. Bernstein2 2 Sergei Natanovich Bernstein (1880$\sim$1968), 俄羅斯數學家, 猶太人, 1904年在巴黎大學上交的博士論文解決了橢圓微分方程的希爾伯特第19問題, 對偏微分方程、微分幾何、機率論與逼近理論都有貢獻。 (1880$\sim$1968) 這位有名的俄羅斯數學家在 1912年, 也就是 一百年前, 發表了他的證明。證明中利用了著名的 Chebyshev 不等式 $$ {\bf P}[|X-a|\gt \varepsilon] \leq Var[X]/\varepsilon^2 $$ 與一些其它論證, 這裡 $a={\bf E}[X], \ \varepsilon\gt 0$。 Bernstein 的想法既簡單又吸引人:

固定 $x \in [0,1]$, 做 $n$ 次獨立的 Bernoulli 試驗 (Bernoulli's trials)3 3 延伸閱讀:「Bernoulli數與Bernoulli多項式(上)」, 數學傳播第16卷第2期; 「Bernoulli 數與 Bernoulli 多項式(下)」, 數學傳播第 16 卷第 3 期; 「Bernoulli 多項式與連續冪次和探討」, 數學傳播第 35 卷第 2 期;「廣義 Pascal 矩陣與Bernoulli 多項式及Euler 多項式」, 數學傳播第37卷第1期。 , 每次試驗 $X_i=1$ 或 $0$ 的機率分別是 $x$ 與 $1-x$. 它們的和 $S_n=X_1+\cdots+X_n$ 是一個隨機變數, 具有以 $n$ 與 $x$ 為參數的二項式分布(binomial distribution)。記為 $$ S_n \sim Bin (n,x), ~~{\bf P}[S_n=k] = \binom{n}{k} x^k (1-x)^{n-k},~ k=0,1,\ldots,n. $$ 現在由 Bernoulli 大數法則 (Bernoulli LLN) 得到: $$ \frac{S_n}{n} \to x, \ \ n \to \infty \ {( {\it Bernoulli LLN} )} \ \Longrightarrow \ B_n(x)={\bf E}\left[f\left(\frac{S_n}{n}\right)\right] \to f(x). $$

附帶一提: 今年 2013 是特別的一年。有好幾個國際機構正式宣布 2013 是統計特別年, 目的是慶祝 三百年 前大數法則第一次出現在 Jacob Bernoulli4 4 Jacob Bernoulli (1654$\sim$1705), 伯努力家族中眾多數學家之一, 對微積分與機率論有重要貢獻。 關於其家族可參考「數學世家 --- 柏努利家族」, 數學傳播第4卷第2期;「BERNOULLI們:一個學者家族」, 數學傳播第15卷第1期。 所寫的書 “Ars Conjectandi” 中。

6. 求 $X + Y = XY$ 的解

首先, 什麼是 $X$ 和 $Y$? 很容易就可以猜到, 如果 $X, Y$ 的意義不同就會產生不同的結果。

  • 如果 $X, \ Y$ 是整數, 則 $X=Y=0$ 或 $X=Y=2$, 得到兩個解。
  • 如果 $X, \ Y$ 是實數, 則 $X$ 和 $Y$ 都不會是1。對於任何 $a \ne 1$, 我們得到
    $$ X=a, \ \hspace{0.3cm} \ Y=\frac{a}{a-1} \hspace{0.3cm} \ \mbox{ (或 $X, Y$ 對調), 也就是有無限多解。} $$
  • 如果 $X$ 和 $Y$ 是複數, 且為 $z=a+ib$ 的形式, 其中 $b \ne 0$, 就會有無限多解如下:
    $$ X=z, \ Y= \frac{z}{z-1} \ \mbox{ (或 $X, Y$ 對調). } $$
  • 假設 $X$ 和 $Y$ 是隨機變數(r.v.), 則得到分布方程式 (distributional equation):
    $$ X + Y \stackrel{d}= XY \hspace{1.0cm} \text{(在分布函數意義下的等式).} $$

我們現在的任務是描述 $X$ 和 $Y$, 也就是找出其值的範圍和分布函數(distribution)。

如果 $X$ 和 $Y$ 的分布函數不同, 或非隨機獨立, 這個問題相當困難而且看來似乎無解。 針對有同樣分布函數且隨機獨立的 $X$ 和 $Y$ 則有些進展。

模型 1: 設 $X$ 和 $Y$ 的共同分布函數 $F$ 是對稱且絕對連續, 令 $f(x)=F'(x)$ 為其密度。 假設所有的動差 $m_k={\bf E}[X^k]=\int x^k dF(x)=\int x^k f(x)dx, \ k=1,2,\ldots, $ 都是有限值。在這些條件下會有以下意想不到的結果: $$ X + Y \stackrel{d}= XY \ \Longleftrightarrow \ f(x)= \frac{1}{\pi \sqrt {4 - x^2}}, \ x \in (-2,2) \hspace{0.4cm} (反正弦分布({\it Arc-Sine Law})). $$

充分性證明 (撇步):由兩個獨立的隨機變數(r.v.) $X$ 和 $Y$ 開始, 在區間 $(-2,2)$ 上它們都有反正弦分布函數, 對於動差 $a_k={\bf E}[X^k],~ b_k={\bf E}[Y^k],~k=1,2,\ldots,$ 得到: $$ a_{2k-1}={\bf E}[X^{2k-1}]=0,~~ \ \ a_{2k}={\bf E}[X^{2k}]=\int_{-2}^2 x^{2k}f(x)dx= \cdots =\binom{2k}{k}. $$

因為 $X$ 與 $Y$ 都是對稱, 和與乘積的奇數階動差(odd order moments) 為零, 也就是 ${\bf E}[(X+Y)^{2k-1}]$ 與 ${\bf E}[(XY)^{2k-1}]$ 都是零。 而偶數階動差(even order moments) 如下: $$ {\bf E}[(XY)^{2n}]=\binom{2n}{n}^2, \ {\bf E}[(X+Y)^{2n}]=\sum_{k=0}^{n} \binom{2n}{2k}a_{2k} b_{2n-2k}= \cdots =\binom{2n}{n}^2. $$

這裡需要用到以下的古典結果。

分布函數的唯一性: (Hausdorff 動差問題) 在 同一有界區間的兩個分布函數若有 一樣的 動差序列, 則分布函數是相同的。

由此可以總結: 如果在區間 $(-2,2)$ 上, $F$ 是反正弦分布函數, 則 $X + Y \stackrel{d}= XY$.

必要性證明:由 $X + Y \stackrel{d}= XY$ 以及上述的條件, 我們想找出 $X$ 和 $Y$ 的未知分布函數 $F$。 使用以上的論證可以證明 $m_{2k}={\bf E}[X^{2k}]=\binom{2k}{k}$。再由 Stirling 公式得到 $\lim_{k \to \infty} (m_{2k})^{-1/(2k)}=1/2$, 因此滿足 Carleman 條件 (Carleman's condition): $\sum_{k=1}^{\infty} (m_{2k})^{-1/(2k)} = \infty$。 對於定義在實數 $\mathbb R$ 上的分布函數, 這個動差條件已經足夠保證分布函數的唯一性 (Hamburger動差問題)。 因為 $\binom{2k}{k}, \ k=1,2,\ldots,$ 是反正弦分布函數的隅數階動差, 所以得到結論: $F$ 是在 $(-2,2)$ 區間上的反正弦分布函數。

模型 2:設 $X$ 和 $Y$ 是離散隨機變數(discrete r.v.), 它們的分布函數 $F$ 是階梯函數(step-wise function); 沒有密度函數。我們有如下的結果:

對任一 $n \in {\Bbb N},$ 可以建構一個離散隨機變數(discrete r.v.) $X$, 取值在 $n+1$ 個數所成的集合 $\{x_0, x_1, x_2, \ldots, x_n\}$, 其中 $x_j \in [-2,2]$, 使得當隨機變數 $Y$ 是 $X$ 的獨立拷貝時, 有 $$ X + Y \stackrel{d}= XY. $$

證明的想法:我們要在區間 $[-2,2]$ 之中挑選出 $n+1$ 個數 $\{x_0, x_1, \ldots, x_n\}$, 使得 $x_i + x_j$ 和 $x_ix_j$ 都落在某一個相同的集合裡。這是做得到的, 例如: $$x_j=2\cos(2c\pi j), \ c=1/(2n+1), \ j=0,1,\ldots,n,$$ $${\bf P}[X=2]=\frac{1}{2n+1}, \qquad {\bf P}[X=x_j]=\frac{2}{2n+1}, \qquad j=1,2,\ldots,n.$$

需要花點心思驗證 $X+Y$ 與 $XY$ 有相同的動差序列, 然後借助以上的分布函數唯一性得到所要的結果。

7. 隨機漫步理論 --- 布里丹之驢的故事

這個不可思議的故事可以用下圖來表示: $$\bigtriangleup \ \cdots\cdots \leftarrow ? \hspace{0.2cm} \blacksquare \hspace{0.2cm} ? \rightarrow \cdots\cdots \ \cup$$

假設左邊 $\bigtriangleup$ 是一堆草, 右邊 $\cup$ 是一桶水, 中間的 $\blacksquare$ 是一頭又餓又渴的驢子。 問號 $?$ 代表它的優柔寡斷, 無法決定該選什麼。根據紀錄, 這隻驢子停留在原地, 最後死了。 這也是我們用黑色方塊的原因。這個故事(真實或虛構)的來源是 J. Buridan, 所以驢子以 BD 表示, 代表布里丹(Buridan)的驢子。關於布里丹簡介如下:

Jean Buridan (1300$\sim$136?):法國哲學家, 邏輯家(亞里斯多德的追隨者), Sorbonne的教授。在巴黎是眾所周知的人物, 特別在上流社會(high-life circles)。 為了他和皇后的緋聞, 憤怒的國王下令將他丟入塞納河處死, 幸好被他的學生營救, 移居奧地利, 創建了維也納大學, 這是他在奧地利的許多活動之一。

讓我們回到驢子 BD。

問:為什麼下場這麼悲慘?

答:它完全無作為!

建議:決定並行動!

這個故事可以轉化為數個描述 D 移動, 確定性或隨機性, 的數學模型。 D 可以是驢子或物理粒子或股票價格或資產。

確定性模型(Deterministic Model): 假設 D (驢子或是物理粒子) 在 $[0,1]$ 區間上移動(motion)。 0 和 1 是吸引點 (當成是 $\bigtriangleup$ 和 $\cup$) 。D 的移動方式是有規定的, 我們指定 D 在每一步移動的方式, 也就是它動的方向和新的位置。 假設 D 由點 $x_0 \in [0,1]$ 開始移動, 如果 $x_0=0$, D 往右移;如果 $x_0=1$, D 往左移。 D 會左右交互移動, 例如是 $r$-$l$-$r$-$l$-$r$-$l$- $\cdots$ ($r$=右, $l$=左)。

固定一個數字 $\lambda \in (0,1)$, 且採用 $\lambda$-rule:如果在時間 $n$, D 的位置是 $x_n$, 之後 D 移動到新的點 $x_{n+1}$, 或左或右, 移動距離的比例是 $\lambda$, 也就是, 如果 D 往右移動, 新的位置是 $x_{n+1}= x_n + \lambda(1-x_n)$;如果 D 往左移, 則 $x_{n+1}=(1-\lambda)x_n$. 下圖我們用空心方塊 $\square$ 代表驢子, 希望它可以移動到 $\bigtriangleup$ 或是 $\cup$, 就有存活的機會。 $$\bigtriangleup \ \cdots\cdots \leftarrow \times \hspace{0.1cm} \lambda \hspace{0.4cm} \square \hspace{0.2cm} \times \lambda \rightarrow \cdots\cdots \ \cup$$

結果: 以數列 $\{x_n, \ n=0,1,\ldots \}$ 描述 D 的移動, 這個數列不收斂。但是它的兩個子數列, `奇數列' $\{x_{2n+1}\}$ 和 `偶數列' $\{x_{2n}\}$, 均收斂到有限值, 其極限如下: $$ L_1%=\lim_{n \to \infty}x_{2n+1} =\frac{1-\lambda}{2-\lambda}, \hspace{0.8cm} L_2%=\lim_{n \to \infty}x_{2n} =\frac{1}{2-\lambda}. $$

結論:最終, D 會在點 $L_1$ 和點 $L_2$ 之間擺盪 (oscillate)。 舉例: 如果 $\lambda = \frac12$, 那麼 $L_1=\frac{1}{3}, \ L_2=\frac{2}{3}$. 很明顯地, 對任一 $\lambda \in (0,1)$, 驢子永遠無法走到終點(end points) 0 或 1。 可憐的 BD!

(0,1) 上的隨機移動 (random motion): 假設 D 由點 $x_0 \in (0, 1)$ 開始隨機移動。 隨機指的是兩者: D 移動的方向, 可以往 0 或往 1, 以及新位置。

拋一個銅板, 其出現正面(H) 和反面 (T)的機率各是 $p$ 和 $q=1-p$. 如果得到 H, D 往右移動; 如果得到 T , D 往左移動。 所以, D 往右移的機率是 $p$, 往左移的機率是 $q=1-p$.

D 的新位置是一個隨機變數 (且有連續的均勻分布函數), 或是在 $(x_0, 1)$ 或是在 $(0,x_0)$。 每一步都要重複這個規則。如果 $X_n$ 代表 D 在時間 $n$ 的位置, 我們知道 D 的移動是個隨機漫步(random walk)。

問: $\lim\limits_{n \to \infty} X_n$ 是什麼? $$0=\bigtriangleup \ \cdots\cdots\leftarrow q \hspace{0.2cm} \square \hspace{0.2cm} p \rightarrow \cdots\cdots \ \cup=1$$

答案: $\{X_n, n=0,1,\ldots\}$ 隨機漫步有一個極限分布(limiting distribution) : $$ \lim_{n \to \infty} X_n \stackrel{d}= \theta, \qquad \theta \sim \beta (p,q); \qquad f_{\theta}(x)=\frac{x^{p-1}(1-x)^{q-1}}{B(p,q)}, \qquad x \in (0,1). $$

等價的說法:隨機序列(random sequence) $\{X_n, n=0,1,\ldots\}$ 是遍歷馬可夫鍊(ergodic Markov chain), 以 $\beta (p,q)$ 為其遍歷分布(ergodic distribution), 而且具有幾何收斂速度。這是模擬一種 $\beta$ 分布的子類的簡單方法。

至於又累又渴的驢子, 它從來沒有到達`夢幻點'(`dream' points) 0 和 1, 所以是個悲慘的結局。另外, D確定會達到 0 或 1 的模型是存在的。

8. 其它可用機率解決的問題

讓我們看另外兩個例子, 更多例子請見參考資料。

  • 黎曼 zeta 函數 $$ \zeta(z) = \sum_{j=1}^{\infty}\frac{1}{j^z}, \qquad Re\,z \gt 1. $$ 有名的公式 $\zeta (2)=\pi^2/6$ 與一些類似的公式可以很容易地從科西分布 (Cauchy distribution) 推導得到。 想法是由隨機變數 $X \sim C(0,1)$ 開始, 其密度函數是 $\frac{1}{\pi}\frac{1}{1+x^2}$, $x \!\in\! {\mathbb R}$, 取 $X$ 的兩個獨立拷貝 $X_1$ 和 $X_2$, 找出乘積 $Y\!=\!X_1X_2$ 的密度函數 $g$。 然後用 $\int g(y)dy\!=\!1$.
  • Kolmogorov-Feynman-Kac公式 ( Kolmogorov-Feynman-Kac formulas). 這些是用來解某類二階橢圓或拋物線偏微分方程式的公式。 這些偏微分方程式的解可以用馬可夫過程(Markov process)某一泛函的期望值來表示, 是 Itô 型的隨機微分方程(stochastic differential equation) 的唯一解, 在此不做詳細介紹。 這些公式組成對偏微分方程求數值解時所用的蒙地卡羅馬可夫鏈方法(Monte Carlo Markov Chain methods) 的基礎。

9. 練習與待解問題

  • (a) 使用已知的古典常數 $\pi$ 和 $e$ 證明 $$ \int_0^1 \cdots \int_0^1 \frac{x_1^{\pi}+ \cdots + x_n^{\pi}}{x_1^{e}+ \cdots + x_n^{e}}dx_1 \cdots dx_n \,\to\, \frac{e+1}{\pi +1} \ \text{ as } \ n \to \infty\,. $$
  • (b) 證明 $$ \frac{1}{1 \cdot 2 \cdot 3} + \frac{1}{4 \cdot 5 \cdot 6} + \frac{1}{7 \cdot 8 \cdot 9} + \cdots \,=\, \frac{\pi {\sqrt 3}}{12} - \frac{1}{4} \log 3\,. $$
  • (c) 證明 $$ \sum_{n=1}^{\infty} \frac{1}{\binom{2n}{n}} \,=\, \frac{9+2{\sqrt 3}\pi}{27}\,. $$
  • (d) 證明或反證: 在 2 的乘冪中,僅有 2, 4, 8, 64, 2048 是純粹由偶數數字寫成的數,其它數最少都有一位數字是奇數。 (此問題是由保加利亞 Pernik 的 Ivan Tiufekchiev 所提供。)

10. 結語

在許多文章、書籍和資料中有很多原先不是用機率語言來敘述的問題, 不過它們的解本質上用到機率的想法或是技巧。

上述的任一個主題都可以被延伸。一些沒有提到的主題可由以下的參考資料中找到。一般來說由文章的標題可以得知文章的內容。

這些都是有趣的材料, 問題也很有意思, 解這些問題需要有不同數學分支的知識。 上面提到的主題與其它類似的主題都是學生練習做計畫的好題材。甚至, 可以是一個研究所程度的特別課程。 透過不同的數學想法、觀念、結果和證明整合的討論, 學生可以多方受益。 自然而然地, 學生就會涉入一些新的、具有挑戰性的數學問題。

致謝: 我在加拿大、希臘、克羅埃西亞、保加利亞、義大利與美國的大學都曾公開講過類似的主題。很榮幸可以在台灣大學數學系與中央研究院數學研究所合辦的這個講座演講。謝謝所有來參加的聽眾以及在演講中或演講後提出問題的人。

將這場英文的演講做成中文的稿件並發表在數學傳播季刊上我覺得是很有意思的想法。為此我感謝主編李宣北教授和助理陳麗伍的用心。

最後, 我要感謝中央研究院統計科學研究所林國棟教授, 協助修改完善我的英文講稿並校對中文翻譯。

我希望讀者, 特別是年輕人或是未來的數學家, 對文中所提到的一些講題感到興趣。如果讀者有任何問題或建議, 歡迎用電子郵件與我聯絡。

參考資料

Athreya, K. B. (1987). Modified Bessel function asymptotics via probability. Statist. $\&$ Probab. Letters 5, 325--327. Bhattacharjee, D. and Mukhopadhyay, N. (2010). Stirling's formula and its extensions: heuristic approaches. Commun. Statist. Theory $\&$ Methods 39, 1046--1053. Billingsley, P. (1995). Probability and Measure, 3rd edn. Wiley, New York. Bollobas, B. (1980). A probabilistic proof of an asymptotic formula for the number of labeled regular graphs. Europ. J. Combinatorics 1, 311--316. Bourgade, P., Fujita, T. and Yor, M. (2007). Euler's formula for $\zeta(2n)$ and products of Cauchy variables. Electron. Commun. in Probab. 12, 73--80. Chang, G. and Xu, C. (2011). Generalization and probabilistic proof of a combinatorial identity. Amer. Math. Monthly 118, 175--177. Cuadras, C. M. and Cuadras, D. (2008). Eigenanalysis on a bivariate covariance kernel. J. Multivar. Analysis 99, 2497--2507. DasGupta, A. (2003). A unified method to sum a variety of infinite series, with applications. Calcutta Statist. Assoc. Bulletin 54, no. 213--214, 1--16. Durrett, R. (1984). Brownian Motion and Martingales in Analysis. Wadsworth, Belmont (CA). Fowler, B. C. and Swift, R. J. (1999). Relabelling dice. College Math. J. 30, 204--208. Fujita, T. (2008). A probabilistic approach to special values of the Riemann zeta function (Number Theory and Probability Theory). Kyoto University Research Information Repository, Vol. 1590, 1--9. Galambos, J. and Simonelli, I. (2004). A purely probabilistic proof for a theorem of Bakstys on multiplicative arithmetical functions. Annales Univ. Sci. Budapest, Sect. Comput. 21, 177--186. Gzyl, H. and Palaciaos, J. L. (2003). On the approximation property of Bernstein polynomials via probabilistic tools. Boletin Asoc. Matem. Venezolana 10, 5--13. Hu, C.-Y., Iksanov, A. M., Lin, G. D. and Zakusylo, O. K. (2006). The Hurwitz zeta distribution. Austral. $\&$ N.Z. J. Statist. 48, 1--6. Kemperman, J. H. B. and Skibinsky, M. (1982). On the characterization of an interesting property of the arcsin distribution. Pacific J. Math. 103, 457--465. Kent, J. (1978). Some probabilistic properties of Bessel functions. Ann. Probab. 6, 760--770. Le Gall, J.-F. (1996). A probabilistic approach to the trace at the boundary for solutions of a semilinear parabolic partial differential equation. Internat. J. Stoch. Analysis 9, 399--414. Miller, S. J. (2008). A probabilistic proof of Wallis's formula for $\pi$. Amer. Math. Monthly 115, 740--745. Norton, R. M. (1975). On properties of the arc sine law. Sankhya 37A, 306--308. Norton, R. M. (1978). Moment properties and the arc sine law. Sankhya 40A, 192--198. Oksendal, B. (2003). Stochastic Differential Equations, 6th edn. Springer, Berlin. Rosalsky, A. (2007). A simple and probabilistic proof of the binomial theorem. Amer. Statistician 61, 161--162. Schuss, Z. (1980). Theory and Applications of Stochastic Differential Equations. Wiley, New York. Shantaram, R. (1982). On a conjecture of Norton's. SIAM J. Appl. Math. 42, 923--925. Shiryaev, A. N. (1995). Probability, 2nd edn. Springer, New York. Speed, T. P. (1976). Geometric and probabilistic aspects of some combinatorial identities. J. Austral Math. Soc. Ser A 22, 462--468. Stoyanov, J. (1986). Probabilistic proof of the convergence of a class of $n$-fold integrals. Glasnik Mathematicki $($Zagreb$)$ 21, 101--114. Stoyanov, J. (2013). Counterexamples in Probability, 3rd edn. Dover Publications, New York. Stoyanov, J. and Pirinsky, Ch. (2000). Random motions, classes of ergodic Markov chains and beta distributions. Statist. $\&$ Probab. Letters 50, 293--304. Tamaki, M. (2009). A probabilistic proof of an identity related to the Stirling number of the first kind. In: Dohi, T. et al., Eds. Recent Advances in Stochastic Operations Research II, pp. 3--9. World Scientific, Singapore.

Note added in proof: In the Spring of 2013, together with P. Kopanov (Plovdiv University, Bulgaria), we decided to look closer to the Conjecture in Section 4. We have prepared a paper which will be submitted for publication soon:

Kopanov, P. and Stoyanov, J. (2013). {Dice, urns, balls, random experiments, sums and products of points, casino numbers.}

In this work we studied in detail the Diophantine equation $(***)$. In particular, any $n$ for which $(***)$ does not have a solution is called a casino number. One of the results, given with complete proof, is that there are infinitely many casino numbers. Hence, the Conjecture is proved to be true. We have given a few interesting extensions and formulated some open questions.

---本文演講者Jordan Stoyanov 教授任教於英國新堡大學, 整理者陳麗伍為中央研究院數學研究所助理---