40402 任意長度等差級數—van der Waerden 話當年

終極密碼

遊戲規則:本遊戲為猜密碼的遊戲。密碼為0到100之間的其中1個整數,電腦會提示密碼的所在範圍,玩家必須在6次之內猜到密碼才能過關。
★ 終極密碼為0到100之間 ★
您共有六次機會

一、菲爾茲獎的光環

陶哲軒 (Terence Chi-Shen Tao) 1975 年 7 月 17 日出生於澳洲, 是第二代澳洲香港移民, 從小天資過人, 研究興趣涵蓋數學各種領域, 24 歲就當了 UCLA 數學系終身教授。 他從小開始, 得過無數的重要獎項, 31 歲的時候、 也就是 2006 年 8 月 22 日, 在西班牙馬德里的國際數學家大會獲得菲爾茲獎 (Fields Medal) , 並於次日在大會做了一小時報告。

陶哲軒得到菲爾茲獎的引文是 「因為他對偏微分方程、組合學、調和分析和加性數論的貢獻。」 他的第一個突出表現是, 和 Ben Green 共同證明了, 可能在幾百年前就被問過的一個有關質數的問題: 「質數裡面是否包含任意長度的等差級數?」 等差級數 (算術級數) 是相鄰兩項相差一個定數的整數列, 例如 3, 5, 7 是一個長度為 3、公差為2的等差級數, 109, 219, 329, 439, 549 是一個長度為 5、公差為 110 的等差級數。

有關了解等差級數的一個大突破, 是匈牙利數學家 Endre Szemerédi 在 1975 年證明了 「正密度的無窮正整數集裡面包含任意長度的等差級數。」 所謂一個集合有正密度, 指的是當 $n$ 夠大時, 這個集合在 $\{1,2,\ldots,n\}$ 當中都含有固定百分比的元素。 不過這個定理並不適用於質數集, 因為它並沒有正密度, 事實上, 當正整數越來越大時, 質數就越來越稀疏。 但是不管質數有多稀疏, Green-Tao 證明了 「質數裡面確實包含任意長度的等差級數。」 他們的這個結果具有高度原創性, 提供一個有深度、 基礎但困難問題的答案, 在質數性質的研究裡創下一個新的突破。

任意長度等差級數的研究, 最早可以追溯到 1927 德國數學家 van der Waerden 的定理 「將正整數分成若干集合, 其中總有一個包含任意長度的等差級數。」 根據 van der Waerden 1971 年回憶文的記載, 他於 1926 年在 Hamburg 大學數學系, 和他的朋友 Emil Artin 與 Otto Schreier 一齊討論 Baudet 猜想, 三人都有一些不錯的構想, 後來他繼續推導, 完成了 1927 年的文章。

根據 Graham [1979] 的看法, 雖然 van der Waerden 在他的文章中一直叫做 Baudet 猜想, 但是有更強的證據顯示, 這個猜想事實上最早是 Schur 在研究模 $p$ 二次剩餘時提出來的, 這可見諸於 Brauer 在 Schur 收集工作 [1973] 的序文。

Schur 證明過的一個定理: 「將正整數分成若干集合, 其中總有一個有 $x_1+x_2+\ldots+x_{n-1}=x_n$ 的解。」 如果將方程式變化, 甚至擴大為解方程組, 可以變化出很多困難的問題。 等差級數就是解方程組 $x_i+x_{i+2}=2x_{i+1}$、$1\le i\le\ell-2$、其中各 $x_i$ 均相異, 換句話說, 要取得正整數 $a$ 和 $d$ 使得 $x_i=a+(i-1)d$、$1\le i\le \ell$, 其中 $d$ 叫做這個等差級數的公差、$\ell$ 叫做它的長度。 有時為了方便也會考慮 $x_i=a+id$、$1\le i\le \ell$ 的表示法。

二、話說 1926 年---van der Waerden 的回憶

現在來回溯 van der Waerden、Artin 和 Schreier 三個人在 1926 年的討論。 這個問題最先的問法是在所有正整數上求等差級數。

猜想 AP1: 若將正整數任意分成兩類, 則對任意 $\ell$、 其中總有一類包含一個長度是 $\ell$ 的等差級數。

這個猜想其實等價於一個看起來很像、 但是比較強的敘述。

猜想 AP2: 若將正整數任意分成兩類, 則其中有一類使得對任意 $\ell$、 這一類總是包含一個長度 $\ell$ 的等差級數。

證明 (AP1)$\Leftrightarrow$(AP2): 猜想 AP2 顯然可以推到猜想 AP1。 反過來, 如果猜想 AP1 成立, 將正整數任意分成兩類 $A_1$ 和 $A_2$, 對任意 $\ell$ 存在 $i_\ell$ 使得 $A_{i_\ell}$ 包含一個長度 $\ell$ 的等差級數, 因為每個 $i_\ell$ 都只能是 1 或 2, 就會有無窮多個 $i_\ell$ 都相等、不失一般性假設是 1, 由於長度是 $\ell$ 的等差級數中有長度是 $\ell-1$ 的等差級數, 對任意 $\ell$、$A_1$ 總是包含一個長度 $\ell$ 的等差級數。 這證明了猜想 AP2。$\tag*{$\Box$}$

一開始他們就知道, 猜想 AP1 對 $\ell=2$ 顯然成立, 甚至不需要考慮所有正整數, 只要考慮 $1,2,3$ 這三個數, 不論將它們如何分類, 總有一類包含兩個數、構成等差級數。

接著討論 $\ell=3$ 的情況, 一樣地、也不需要考慮所有正整數, 只要考慮 $1$ 到 $9$ 這九個數。 如果只考慮 $1$ 到 $8$ 是不夠的, 因為可以分成 $\{1,2,5,6\}$ 和 $\{3,4,7,8\}$、 其中沒有一類包含長度是 3 的等差級數, 但是如果把 9 加到任何一類中、就會產生長度是 3 的等差級數。

一般來說, 如果將 $\{1,2,\ldots,9\}$ 分成 $A$ 和 $B$ 兩類, 並假設沒有任何一類有長度 3 的等差級數。 考慮正中央三個數 $4,5,6$ 的狀態, 它們不可能屬於同一類, 在排除鏡射組合和兩類互換的情況之後, 不失一般性這三個數的組合可分成下面兩種情況 $$ \mbox{ $4,6 \in A$、$5 \in B$, 或者 $4,5 \in A$、$6 \in B$。 } $$ 第一種情況中, 考慮 $(2,4,6)$ 和 $(4,6,8)$ 這兩組等差級數便知道 $2,8 \in B$, 因此, $B$ 當中就有 $(2,5,8)$ 這組等差級數, 矛盾。 第二種情況中, 考慮 $(3,4,5)$ 得知 $3 \in B$, 再考慮 $(3,6,9)$ 得知 $9 \in A$, 再考慮 $(1,5,9)$ 和 $(5,7,9)$ 得知 $1,7 \in B$, 最後考慮 $(1,2,3)$ 和 $(6,7,8)$ 知道 $2,8 \in A$。 但這麼一來, 得到 $A$ 中有 $(2,5,8)$, 又矛盾。

接著 Schreier 提問, 這樣的做法是不是對每一個固定的 $\ell$ 都對? 也就是, 猜想 AP1 是否等價於猜想 AP3? Schreier 證明了 猜想 AP1 的確等價於猜想 AP3。

猜想 AP3: 對任意正整數 $\ell$, 存在正整數 $N(\ell)$ 使得, 若將 $\{1,2,\ldots,N(\ell)\}$ 任意分成兩類, 則其中總有一類包含一個長度是 $\ell$ 的等差級數。

證明 (AP1)$\Leftrightarrow$(AP3): 猜想 AP3 顯然可以推到猜想 AP1, Schreier 利用對角線程序證明了猜想 AP1 可以推到猜想 AP3。 假設猜想 AP1 成立、但是猜想 AP3 卻不成立, 則對任意正整數 $N$ 總可以將 $\{1,2,\ldots,N\}$ 分成兩類、 使得這種分割 $D_N$ 中沒有一類包含長度是 $\ell$ 的等差級數, 觀察所有分割所成的列 $$ D_1, D_2, D_3, \ldots\mbox{, } $$ 考慮 1 這個數, 對每一個分割, 它總是落在其中的一類, 所以 $D_1, D_2, D_3, \ldots$ 有無窮子列 $D_1'$, $D_2'$, $D_3', \ldots$ 使得 1 總是落在每一分割的同一類、 設為第 $i_1$ 類、 其中 $i_1\in\{1,2\}$。

在 $D_2', D_3', D_4', \ldots$ 中, 2 總是落在每一個分割的某一類, 所以 $D_2', D_3', D_4', \ldots$ 有無窮子列 $D_2'', D_3'', D_4'', \ldots$ 使得 2 總是落在每一分割的同一第 $i_2$ 類中。 依此類推, 可以得到無窮子列 $$ D_n^{(n)}, D_{n+1}^{(n)}, D_{n+2}^{(n)}, \ldots $$ 使得對所有分割 $1,2,\ldots,n$ 都在同一類中:
    1 在第 $i_1$ 類、
    2 在第 $i_2$ 類、
     $\vdots$
    $n$ 在第 $i_n$ 類。

利用這些資訊, 考慮所有正整數的分割 $D$、其中 1 在第 $i_1$ 類、2 在第 $i_2$ 類、依此類推 $n$ 在第 $i_n$ 類等。 在這個分割, $n$ 所在的類和它在 $D_n^{(n)}$ 所在的類相同, 這就是稱為對角線程序的原因。

在 $D$ 裡面不會有一類包含長度 $\ell$ 的等差級數。 如果 $D$ 的某一類包含一個長度 $\ell$ 的等差級數, 設其最後一項是 $n$, 則這個等差級數也在 $D_n^{(n)}$ 中某一類, 這和原來 $D_N$ 中任一類都不包含長度 $\ell$ 的等差級數矛盾。$\tag*{$\Box$}$

前面已經知道 $N(2)=3$ 及 $N(3)=9$。 他們希望利用歸納法, 由 $N(\ell-1)$ 去推導 $N(\ell)$。 Artin 觀察到, 做歸納法的時候, 與其討論將正整數分成兩類、 不如將它分成更多類。 Artin 也證明這和原來的猜想是等價的。

猜想 AP4: 對任意正整數 $k$ 和 $\ell$, 存在正整數 $N(k,\ell)$ 使得, 若將 $\{1,2,\ldots,N(k,\ell)\}$ 任意分成 $k$ 類, 則其中總有一類包含一個長度是 $\ell$ 的等差級數。

證明 (AP3)$\Leftrightarrow$(AP4): 猜想 AP4 取 $k=2$ 就是猜想 AP3。

假設猜想 AP3 成立, 對於猜想 AP4 當 $k=2$ 時, 取 $N(2,\ell)=N(\ell)$。 當 $k=4$ 時, 取 $N(4,\ell)=N(N(2,\ell))$, 若將 $\{1,2,\ldots,N(N(2,\ell))\}$ 任意分成 $4$ 類 $A_1, A_2, A_3, A_4$, 則 $A_1\cup A_2$ 或 $A_3\cup A_4$ 中總有一類、 不妨假設是 $A_1\cup A_2$、 包含一個長度是 $N(2,\ell)$ 的等差級數 $a+d, a+2d, \ldots, a+N(2,\ell)d$。 對 $i=1,2$ 令 $A_i'=\{j: 1\le j \le N(2,\ell), a+jd\in A_i\}$, 則 $\{1,2,\ldots,N(2,\ell)\}$ 被分成 $A_1'$ 和 $A_2'$ 兩類, 所以其中總有一類 $A_i'$ 包含一個長度是 $\ell$ 的等差級數 $a'+d', a'+2d', \ldots, a'+\ell d'$, 將它還原就會是 $A_i$ 中長度是 $\ell$ 的等差級數 $(a+a'd)+d'd, (a+a'd)+2d'd, \ldots, (a+a'd)+\ell d'd$ 這證到 $k=4$ 的情況。 用歸納法就可得到 $k=2^r$、進而 $k \le 2^r$ 的敘述。$\tag*{$\Box$}$

於是他們開始證明猜想 AP4。 這是歸納法證明常見的的做法: 要證明一個敘述, 透過證明另一個更強的敘述, 可以提供歸納法假設更多資訊, 證明反而更容易。

三、數學實驗

數學的研究學習裡沒有實驗的說法, 但是其實大部分的研究, 還是從小的例子觀察歸納, 這可以說是數學裡的實驗。 現在來看看他們想要證明猜想 AP4 所作的實驗。

當 $\ell=2$ 時顯然可以取 $N(k,2)=k+1$。 雖然之前已經用窮舉法算出 $N(2,3)$, 他們還是開始嘗試 $k=2$、$\ell=3$ 的情況。

他們用 2 條平行線表示整數分成的 2 類, 用短的垂直線段表示各類中的數, 如圖 1 所示。 連續 5 個正整數所成的區塊, 前 3 個數必有 2 個在同一類中, 它們形成長度為 2 的等差級數, 等差級數的第 3 項必在同一區塊, 如果它與前 2 項在同一類, 就得證; 可以假設它在另一類, 如圖 1 所示。

圖一:兩類及其上整數表示法。

長度 5 的區塊依其中各數在不同類總共有 $2^5=32$ 型, 所以在連續 33 個區塊中有 2 塊是同型的, 如圖 2 所示。

圖二:同型的兩區塊。

接下來找第 3 區塊、使其與第 2 區塊的距離、等於第 2 區塊到第 1 區塊的距離, 如圖3 所示。 標出第 3 區塊中與前 2 區塊相同的位置的 3 數, 則前 2 數要在不同類中、不然就找到長度 3 的等差級數, 第 3 數不論在那一類, 也都會形成 $aaa$ 或 $bbb$ 的等差級數。 所以最多只要 $2\cdot 2^5+1=65$ 個區塊、 也就是 $5\cdot 65=325$ 個數, 就可以找到長度 3 的等差級數。 可取 $N(2,3)=325$。

圖三:不可避免的等差級數。

接著討論 $k=\ell=3$ 的情況。 類似地, 用 3 條平行線表示整數分成 3 類, 用短垂直線段表示各類中的數。 連續 7 個正整數所成的小區塊, 前 4 個數必有 2 個在同一類中、設為第 1 類, 它們形成長度 2 的等差級數, 等差級數的第 3 項必在同一小區塊, 可以假設它在另一類、設為第 2 類, 如圖 4 第 1 個小區塊所示。 長度 7 的小區塊依其中各數在不同類總共有 $3^7$ 型, 所以在連續 $3^7+1$ 個區塊中有 2 塊是同型的, 如圖 4 前 2 個小區塊所示。 接下來找第 3 小區塊、使這 3 個小區塊等距, 如圖 4 所示。 標出第 3 區塊中與前 2 區塊相同的位置的 3 數, 則前 2 數要在不同類中、設為第 2/3 類, 第 3 數則會在第 3 類, 不然都會找到長度 3 的等差級數。 從第 1 到第 3 個小區塊只要 $r\le 2\cdot 3^7+1$ 個小區塊, 將它們合成如圖 4 的大區塊。

圖四:三個小區塊合成一個大區塊。

一個大區塊有 $r$ 個小區塊, 共有 $7r$ 個數, 依其中各數在不同類總共有 $3^{7r}$ 型, 所以在連續 $3^{7r}+1$ 個大區塊中有 2 塊是同型的, 如圖5 所示。

圖五:同型的兩個大區塊。

接下來找第 3 大區塊、使這 3 個大區塊等距, 如圖6 所示。 標出第 3 個大區塊中與前 2 個大區塊相同的位置的數, 則第 3 個大區塊中最末一個標示為 $\times$ 的數不論在那一類, 也都會形成 $aaa$、$bbb$ 或 $ccc$ 的等差級數。 所以最多只要 $2\cdot 3^{7r}+1$ 個大區塊、 也就是 $7 r (2\cdot 3^{7r}+1) \le 7 (2\cdot 3^7+1) (2\cdot 3^{7(2\cdot 3^7+1)}+1)$ 個數, 就可以找到長度 3 的等差級數。 可取 $N(3,3)=7 (2\cdot 3^7+1) (2\cdot 3^{7(2\cdot 3^7+1)}+1)$。

圖六:不可避免的等差級數。

至此, 他們都相信同樣的論證可以證明猜想 AP4。 不過 Artin 和 Schreier 還是不放心, 希望看看 $\ell=4$ 的證明, 他們還是先考慮 $k=2$ 的情況。

如前所示, 連續 $n=N(2,3)$ 個正整數中必有一類含有長度是 3 的等差級數, 可設 $n$ 是奇數, 並考慮連續 $g=n+(n-1)/2$ 個正整數所成的區塊, 則等差級數的第 4 項在此區塊內, 而且可假設是在與前 3 項不同的一類, 如圖7 所示。

圖七:長度4的級數。

長度 $g$ 的區塊依其中各數在不同類總共有 $2^g$ 型, 所以在連續 $N(2^g,3)$ 個區塊中有等距的 3 塊是同型的, 如圖8 所示。 按照同樣距離找出第 4 區塊, 就會形成 $aaaa$ 或 $bbbb$ 的等差級數。

圖八:同型的三區塊。

至此他們完全同意, 由 $\ell-1$ 的結論可以推到 $\ell$ 的結論。 他們的這個建構性的討論, van der Waerden 將其概念大力推演, 終於完成了 1927 年發表的定理。

van der Waerden 在 1971 年寫下前述的回憶文, 展現了數學家不把成就集於自身的風範, 值得大家學習。

四、證明 van der Waerden 定理

這一節正式證明 van der Waerden 定理, 這裡引用 Graham 和 Rothchild [1974] 的簡短證明。 前述將一個集合 $A$ 分成 $k$ 類 $A_1,A_2,\ldots, A_k$, 也就是 $A=\cup_{1\le i\le k} A_i$、且對 $i\ne j$ 有 $A_i\cap A_j=\emptyset$, 習慣上人們也常把它叫做 $A$ 的一個 $k$-著色, $A_i$ 中的元素稱為著第 $i$ 種顏色。

定理1:[van der Waerden 定理 $\lbrack$1927$\rbrack$] 對於任意的正整數 $k, \ell$ 都存在一個正整數 $w(k,\ell)$, 使得若將 $\{1,2,\ldots,w(k,\ell)\}$ 作 $k$-著色, 則必存在同色的、長度為 $\ell$ 的等差數列。

證明: 用 $\{0,1,\ldots,\ell\}^m$ 表示所有 $(x_1, x_2, \ldots, x_m)$、 其中各 $x_i \in \{0,1,\ldots,\ell\}$、 的集合。

這個集合中的兩元素稱為 $\ell$-等價 ($\ell$-equivalent) $(x_1, x_2, \ldots, x_m) \sim (y_1, y_2, \ldots, y_m)$ 是指它們的對應項在最後一次出現 $\ell$ 之前都相等, 也就是, 若 $s$ 是使得當 $i\ge s$ 時 $x_i\lt \ell$ 且 $y_i\lt \ell$ 的最小指標, 則當 $j\lt s$ 時 $x_j=y_j$。 底下以雙層歸納法證明敘述 $S(\ell,m)$:
對所有 $k$, 存在 $w(k,\ell,m)$ 使得對於 $\{1,2,\ldots,w(k,\ell,m)\}$ 的任意 $k$-著色 $C$, 存在正整數 $a, d_1, d_2, \ldots, d_m$ 使得 $a+\sum_{i=1}^m \ell d_i\le w(k,\ell,m)$、而且在 $\{0,1,\ldots,\ell\}^m$ 的等價類中所有 $(x_1, x_2, \ldots, x_m)$ 所對應的 $C(a+\sum_{i=1}^m x_i d_i)$ 都相等。

當 $m=1$ 時, 因為 $\{(x_1): 0\le x_1 \lt \ell\}$ 是 $\ell$-等價類, 所以 $\{a+x_1d_1: 0\le x_1 \lt \ell\}$ 是同色的等差級數, $w(k,\ell,1)$ 就是所想要求的 $w(k,\ell)$。 $S(1,1)$ 顯然成立, 所以只要證明下面兩個陳述。

(甲) 若 $S(\ell,m)$ 成立, 則 $S(\ell,m+1)$ 成立。

證明: 固定一個 $k$, 令 $w=w(k,\ell,m)$ 及 $w'=w(k^w,\ell,1)$, 為了證明 $ww'$ 是所要求的 $w(k,\ell,m+1)$, 考慮 $\{1,2,\ldots,ww'\}$ 的任意 $k$-著色 $C$, 將這個集合分割成 $w'$ 個區塊, 每一區塊含有 $w$ 個連續的數, 依其中各數所著的顏色總共有 $k^w$ 型, 將每一區塊視同一個數, 就等同在考慮 $\{1,2,\ldots,w'\}$ 這個集合。 更精確來說, 定義 $\{1,2,\ldots,w'\}$ 的 $k^w$-著色 $C'$ 使得 $C'(i)=C'(i')$ 若且為若 $C((i-1)w+j) = C((i'-1)w+j)$ 對 $1 \le j \le w$ 都成立。 由歸納法假設, 存在 $a'$ 和 $d'$ 使得 $C'(a'+xd')$ 對所有 $0 \le x \le\ell-1$ 都相同。 將 $S(\ell,m)$ 應用在 $\{(a'-1)w+1, (a'-1)w+2,\ldots,a'w\}$, 根據 $w$ 的定義, 存在 $a, d_1, d_2, \ldots, d_m$ 使得 在 $\{0,1,\ldots,\ell\}^m$ 的等價類中所有 $(x_1, x_2, \ldots, x_m)$ 所對應的 $C(a+\sum_{i=1}^m x_i d_i)$ 都相等。 令 $d_{m+1} = d' w$, 則 透過前述的 $C'$, 對於 $\{1,2,\ldots,ww'\}$ 在 $\{0,1,\ldots,\ell\}^{m+1}$ 的等價類中所有 $(x_1, x_2, \ldots, x_{m+1})$ 所對應的 $C(a+\sum_{i=1}^{m+1} x_i d_i)$ 都相等。 這證明 $S(\ell,m+1)$ 成立。$\tag*{$\Box$}$

(乙) 若 $S(\ell,m)$ 對所有 $m$ 都成立, 則 $S(\ell+1,1)$ 成立。

證明: 固定一個 $k$, 考慮 $\{1,2,\ldots,2w(k,\ell,k)\}$ 的任意 $k$ 著色 $C$, 存在 $a, d_1, d_2, \ldots, d_k$ 使得 $a+\sum_{i=1}^k \ell d_i \le w(k,\ell,k)$、 而且在 $\{0,1,\ldots,\ell\}^k$ 的等價類中所有 $(x_1, x_2, \ldots, x_k)$ 對應的 $C(a+\sum_{i=1}^k x_i d_i)$ 都相等。 根據鴿籠原理, $\{0,1,\ldots,k\}$ 當中存在 $u \lt v$ 使得 $$ \mbox{ $C(a+\sum_{i=1}^u \ell d_i) = C(a+\sum_{i=1}^v \ell d_i)$。 } $$ 這個式子再加上 $S(\ell,k)$ 就會得到, 對 $0\le x \le\ell$, 所有 $C((a+\sum_{i=1}^u \ell d_i) +x(\sum_{i=u+1}^v d_i))$ 都相等。 這證明 $S(\ell+1,1)$ 成立。$\tag*{$\Box$}$

五、Erdős 和 Turán 1936 年的工作

van der Waerden 定理進一步可以推廣到 Hales-Jewett 定理 [1963]。 這個定理用通俗的說法可以這麼描述: 對於任意給定的正整數 $k$ 和 $n$, 總是存在 $h=h(k,n)$ 使得當 $h$-維的 $n$ 階陣列被 $k$-著色的時候, 一定存在某個同顏色的行、列或者對角線。 換句話說, 無論有多少人玩, 當我們在夠高維度的空間玩井字遊戲的時候, 最後就一定能夠分出勝負, 不會有平手的結局。

不過, 接下來我們要從另一個角度來討論。

1936 年 Erdős 和 Turán 用另一種觀點研究等差級數的問題。 對於任一正整數 $\ell$, 一個 $A_\ell$ 數列是指、 不存在長度是 $\ell$ 的等差級數當做子列的數列, 用 $r_\ell(n)$ 表示 $\{1,2,\ldots,n\}$ 內的 $A_\ell$ 數列的最大長度。 如果 $a_1 \lt a_2 \lt \ldots \lt a_r$ 是一個 $\{1,2,\ldots,n\}$ 內的 $A_\ell$ 數列, 則 \begin{eqnarray} && n+1-a_r \lt n+1-a_{r-1} \lt \ldots \lt n+1-a_1\mbox{, } \label{eq e1} \\ && a_1-k \lt a_2-k \lt \ldots \lt a_r-k\mbox{、其中} k\lt a_1 \label{eq e2} \end{eqnarray} 也都是 $\{1,2,\ldots,n\}$ 內的 $A_\ell$ 數列, 所以 \begin{eqnarray} && r_\ell(m+n) \le r_\ell(m) + r_\ell(n)\mbox{, 特別是} r_\ell(2n) \le 2 r_\ell(n)\mbox{。} \label{eq e3} \end{eqnarray} 尤有進著, 當 $\ell=3$ 時會有不等式 \begin{eqnarray} && r_3(2n+1) \le 2 r_3(n)\mbox{, } \label{eq e4} \end{eqnarray} 這是因為對 $\{1,2,\ldots,2n+1\}$ 內的任意最長 $A_3$ 數列, 如果它不包含 $1$ 或 $2n+1$, 則 $r_3(2n+1) \le r_3(2n)\le 2r_3(n)$ 就得到式 (\ref{eq e4}); 否則這個 $A_3$ 數列就不含 $n+1$, 考慮 $n+1$ 前後兩段也會得到式 (\ref{eq e4})。 利用歸納法可得: \begin{eqnarray} && \mbox{當} r_3(a) \le b \mbox{時, 對} k\ge 0 \mbox{恆有} r_3((a+1)2^k-1) \le b 2^k\mbox{。} \label{eq e5} \end{eqnarray} Erdő-Turán 的推導可以寫成一般定裡, 如下所述。 定理2 若 $r_3(a) \le b$、$\varepsilon \gt 0$、$n \gt \max\{a+1,b/\varepsilon\}$, 則 $r_3(n) \lt (\frac{b}{a+1}+\frac{b}{2a(a+1)}+\varepsilon) n$。

證明: 首先取整數 $k$ 使得 $(a+1)2^k \le n \le (a+1)2^{k+1}-1$, 接著再取整數 $c$ 使得 $(a+1)2^k+a(c-1) \le n \le (a+1)2^k-1+ac$, 此時 $a(c-1) \le (a+1)2^{k+1}-1-(a+1)2^k$、 而有 $2a(c-1) \le (a+1)2^k+a(c-1)-1 \lt n$。 所以 \begin{align*} r_3(n) &\le r_3((a+1)2^k-1+ac) \\ &\le r_3((a+1)2^k-1) + r_3(a) c \mbox{ (根據式 (\ref{eq e3})) } \\ &\le b2^k+bc \mbox{ (根據式 (\ref{eq e5})) } \\ & = \mbox{$\frac{b}{a+1}$} ((a+1)2^k+a(c-1)) + \mbox{$\frac{b}{2a(a+1)}$} 2a(c-1)+b \\ & \lt \mbox{$(\frac{b}{a+1}+\frac{b}{2a(a+1)}+\varepsilon) n$}\mbox{。}\tag*{$\Box$} \end{align*}

可以證明 $r_3(8) \le 4$。 如果 $r_3(8) \ge 5$, 考慮 $\{1,2,\ldots,8\}$ 內長度是 5 的 $A_3$ 數列, 由式 (\ref{eq e1}) 可假設 $\{1,2,3,4\}$ 有此數列的 3 項, 只可能是 $1,2,4$ 或 $1,3,4$; 前者迫使此數列不含 $6,7$、也就是 $1,2,4,5,8$、含有等差級數 $2,5,8$, 後前者迫使此數列不含 $5,7$、也就是 $1,3,4,6,8$、含有等差級數 $4,6,8$, 都不可能。 所以 $r_3(8)\le 4$。 利用定裡2 得知 $$ \mbox{ 當 $\varepsilon \gt 0$ 及 $n \gt \max\{9,4/\varepsilon\}$ 時 $r_3(n) \lt (\frac{4}{9}+\frac{1}{36}+\varepsilon) n$。 } $$ Erdős-Turán 的文章內少了 $\frac{1}{36}$ 這一項。 利用更多冗長、但未寫出來的論證, 可以得到 $r_3(23)=9$, 因此 $n$ 大的時候 $r_3(n) \lt (\frac{3}{8}+\varepsilon)n$。 其實和前面一樣, 應該是 $r_3(n) \lt (\frac{3}{8}+\frac{3}{368}+\varepsilon)n$。 他們猜想應該是

猜想 ET(3): $r_3(n) = o(n)$。

事實上, 因為 $r_3(41)=16$, G. Szekeres 曾經猜想 $r_3(\frac{1}{2}(3^k+1))=2^k$, 這對 $k=1,2,3,4$ 都成立* * 因為 $\{u\in\mathbb{N}: u \le (3^k+1)/2$ 且 $u-1$ 的三進位表示法中各位數都不是 $2\}$ 不含長度 3 的等差級數, 所以 $r_3((3^k+1)/2) \ge 2^k$。 。 利用這等式及定裡2, 當 $k\to \infty$ 就可以得到猜想 ET(3)。 更一般來說, Szekeres 猜想對任一質數 $p$ 會有 $$ r_p\left(\frac{(p-2) p^k+1}{p-1}\right) = (p-1)^k\mbox{。} $$ 這可以用來提供 van der Waerden 定裡的一個新的證法, 事實上可以推到 $N(k,\ell) \lt \ell^{c \ell\log k}$。 而且, 也同樣的會有對一般 $\ell$ 的猜想:

猜想 ET($\ell$): $r_\ell(n) = o(n)$。

Roth 在 1953 年利用 Hardy-Littlewood 圈法證明了猜想 ET(3), 他其實是得到 $r_3(n) = O(n/\log\log n)$。 Szemerédi 在 1969 年利用組合學的方法證明了猜想 ET(4); 而 Roth 則在 1972 年利用類似證明猜想 ET(3) 的方法證明了猜想 ET(4)。 最後, Szemerédi 終於在 1975 年利用非常巧妙而複雜組合學的方法證明了猜想 ET($\ell$)。 後來還有一些其他的證明方法, 比較重要得如: Hillel Furstenberg [1977] 利用鞅論的證明、 Timothy Gowers [2001] 利用傅氏分析和組合學的證明。

六、Szemerédi 1975 年的工作及其後續

我們再來把上面的描述作更詳細的說明。 首先, Szemeredi 在 1975 年所證明的定理, 可以有各種不同的描述方法, 以下引用三個等價敘述。

Szemerédi 定理 (第一版本) : 對於任意正整數 $\ell$, 若 $A_\ell(n)$ 表示 $\{1,2,\ldots,n\}$ 中可以找到的最多元素數其中不包長度是 $\ell$ 的等差級數, 則 $\lim_{n\to\infty} A_\ell(n)=0$。

Szemerédi 定理 (第二版本) : 若某些正整數所成的集合 $A$ 滿足 $\limsup_{n\to\infty} |A \cap \{1,2,\ldots$, $n\}|/n\gt 0$, 則對於任意正整數 $\ell$, 在 $A$ 中都可以找到長度是 $\ell$ 的等差級數。

Szemerédi 定理 (第三版本) : 若某些正整數所成的集合 $A$ 滿足、 存在一個正數 $r$ 使得對每一個正整數 $m$ 都有正整數 $n\ge m$ 滿足 $|A\cap \{1,2,\ldots,n\}| \ge rn$, 則對於任意正整數 $\ell$, 在 $A$ 中都可以找到長度是 $\ell$ 的等差級數。

Szemerédi 是利用正則引理 (regularity lemma) 證明了上述定理, 後來正則引理就被視為有用的工具、應用到其他各種不同定理的證明。

Gauss 曾經發現一個有關質數的分布、 但證明困難的定理: 「不超過 $n$ 的質數的個數 $\pi(n)$ $\sim n/\ln n$」, 也就是說, 當 $n$ 越來越大時, 質數在 $\{1,2,\ldots,n\}$ 所佔的百分比大約是 $1/\ln n$ 就越來越小, 最後趨近於 0。 這就是為何 Szemerédi 定理不能用來證明 Green-Tao 的質數中有任意長度等差級數這個定裡的理由。

其實, Erdős-Turán 還有一個比 ET($\ell$) 更一般的猜想, 為了區分起見, 我們把 ET($\ell$) 叫做 Erdős-Turán 弱猜想, 而較強的叫做 Erdős-Turán 強猜想。 這次它把前述某些正整數所成的集合 $A$ 想成是正整數列 $\{a_i\}_{i=1}^\infty$。

Erdős-Turán 強猜想: 若正整數列 $\{a_i\}_{i=1}^\infty$ 滿足 $\sum_{i=1}^\infty 1/a_i=\infty$, 則對於任意正整數 $\ell$, 在 $\{a_i\}_{i=1}^\infty$ 中都可以找到長度是 $\ell$ 的等差級數。

Erdős 強猜想可以推到弱猜想。 假設強猜想是對的, 要證明弱猜想, 任取一個正密度的無窮正整數集 $A$, 存在正整數 $d$ 和 $j$ 使得 $n\ge jd$ 時 $|A\cap \{1,2,\ldots,n\}|\ge n/d$, 特別是 $i\ge j$ 時 $|A\cap \{1,2,\ldots,id\}| \ge i$, 所以存在 $\{a_i\}_{i\ge j}$ 其中 $a_i \in A\cap \{1,2,\ldots,id\}$, 得知 $\sum_{i\ge j} 1/a_i \ge \sum_{i\ge j} 1/id = \infty$。 由強猜想, 對於任意正整數 $\ell$, $\{a_i\}_{i=1}^\infty$、因而 $A$ 中都可以找到長度是 $\ell$ 的等差級數。

Erdős 強猜想到現在還未被解答, Green-Tao 的定理只證明了它的一個特例, 那是因為: $$ \mbox{ 「如果 $p_i$ 是第 $i$ 個質數, 則 $\sum_{i=1}^\infty 1/p_i = \infty$。」 } $$ 這個事實最早由 Euler 透過無窮數列的乘積證明。 無窮數列的乘積, 涉及存在性的種種要求, 比較不容易瞭解。 Erdős 獨具慧眼, 他曾經給出如下的初等證明。

假設 $\sum_{i=1}^\infty 1/p_i = c$, 則存在一個正整數 $j$ 使得 $\sum_{i\gt j} 1/p_i \lt 1/2$。 定義 $N(x)$ 是不超過 $x$ 且不能被任何 $p_i$、$i\gt j$、整除的正整數 $n$ 的個數。 設 $n=k m^2$, $k$ 不再含平方因子 (任何整數都可以這樣) 。 由於只有 $j$ 個質數能整除 $k$, $k$ 最多只有 $2^j$ 種選擇。 又因為 $m$ 最多只能取 $\sqrt{x}$ 個值, 我們得到 $N(x) \le 2^j\sqrt{x}$, 所以不超過 $x$ 且能被某個 $p_i$、$i\gt j$、整除的正整數 $n$ 的個數是 $x?N(x)$。 因為不超過 $x$ 且能被 $p $整除的整數最多有 $x/p$ 個, 我們得到 $x-N(x) \lt \sum_{i\gt j} x/p_i \lt x/2$、 也就是 $x/2 \lt N(x) \le 2^j\sqrt{x}$, 這是不可能的, 因為 $j$ 是定數、而 $x$ 可以任意變大。 所以得證。

任意長度等差級數的研究, 由 van der Waerden 一直到 Green-Tao 的工作, 這並不是一個結束, 而是一個開始。 這個開始, 展現了這群聰慧的數學家、將數學的各個領域融於一爐的本領, 也提醒人們、數學一體不可劃分的本質。 在這過程中, 最值得人們借鏡的是, 像 van der Waerden 那樣, 不把成就集於自身的風範。

參考文獻

P. Erdős and P. Turán, On some sequences of integers, J. London Math. Soc., 11, 261-264, 1936. R. L. Graham, Rudiments of Ramset Theory, CBMS Regiongal Conf. Series in Math., Number 45, AMS, Rhode Island, 1979. R. L. Graham and B. L. Rothschild, A short proof of van der Waerden's theorem on arithmetic progressions, Proc. Amer. Math. Soc., 42, 385-386, 1974. A. Hales and R. Jewett, Regularity and positional games, Trans. Amer. Math. Soc., 106, 222-229, 1963. K. F. Roth, On certain sets of integers, J. London Math. Soc., 28, 104-109, 1953. K. F. Roth, Irregularities of sequences relative to arithmetic progressions, IV, Periodica Math. Hungar., 2, 301-326, 1972. I. Schur, Über die Kongruenz $x^m+y^m\equiv z^m$ (mod $p$), Jber. Deutsch. Math.-Verein., 25, 114-116, 1916. I. Schur, Gesammelte Abhandlungen, Berlin: Springer-Verlag, 1973. E. Szemerédi, On sets of integers containing no four elements in arithmetic progression, Acta Math. Acad. Sci. Hung., 20, 89-104, 1969. E. Szemerédi, On sets of integers containing no $k$ elements in arithmetic progression, Acta Arithmetica, 27, 199-245, 1975. B. L. van der Waerden, Beweis einer Baudetschen Vermutung, Nieuw. Arch. Wisk., 15, 212-216, 1927. B. L. van der Waerden, How the proof of Baudet's conjecture was found, Studies in Pure Mathematics (Presented to Richard Rado), Academic Press, London, 251-260, 1971.

---本文作者任教國立台灣大學數學系---