43206 抽籤的公平性
抽籤的公平性

1. 引言

過往還在施行徵兵制的年代, 在兵役抽籤現場, 待抽籤的役男泰半不願意抽到「海軍陸戰隊」。 抽籤時常會見到一個特殊景象 : 每當抽籤主持人宣布又再度抽出一支海軍陸戰隊, 那台下還沒抽籤的役男們就會爆出聲聲歡呼, 因為在他們心中, 抽籤箱中每當少了一支「海陸」, 那麼還沒抽籤的他們抽到海陸的機率又降低了一些。

這樣的想法正確嗎? 在網路世界中, 抽籤的公平性問題在 PTT 的軍旅版、 八卦版以及數學板等都是個歷久不衰的討論熱題 ()。

事實上現場群眾歡呼的想法是錯的。 因為我們可以利用數學的機率理論證明, 不管是在抽籤順序中排前還是排後, 每個人中籤的機率都是相同的! 其實現行高中數學教材已對抽籤問題較小的模型進行討論, 題目的形式大概都是 : 「設籤筒中有 5 支籤, 其中恰有 2 支有獎。 今有 5 人依序抽籤(取後不放回), 求下列各事件發生的機率 : (1) 第 1 人中獎; (2) 第 3 人中獎; (3) 第 5 人中獎。 ( 3-3 例題5、 3-3 例題 5、 3-3 例題 4、 3-3 例題 4)」多數教科書在這道例題後都給出以下結論 : 「從例題 5 及其後的隨堂練習, 我們看到每個人中獎的機率都一樣。 一般而言, 抽籤中獎的機率與抽籤的次序無關。 (, p.125)」然而, 所有課本都沒有討論或證明一般情況。 建國中學的林信安老師在其講義中討論了一般情況的證明 (), 不過林老師並非使用條件機率的公式或定理來導出一般情況的結果, 而是將抽籤過程整體視為一種有序排列, 以排列的觀點來論證。

從前我讀高中時, 也是以排列的觀點來思考, 當時想得不夠深, 能得到答案就沾沾自喜, 但心中始終隱約有個疙瘩。 如今身分轉換, 在補習班執教鞭, 每每講到這一段時, 總感覺自己講得不夠透徹, 當年的疙瘩愈發襲上心頭。 沉思一陣子, 心中的疑問逐漸澄清 : 「如果這個結果要用排列的觀點來解釋, 那為何這題目要放在條件機率的章節呢? 課本與參考書都是針對較小的人數與籤數論證, 可是又說『一般情況也成立』, 那為何不給出論證呢?」 遍查相關資料, 大多語焉不詳, 一直沒有見到令人信服的講法。 今年暑假, 趁著學生們指考完後比較空閒, 花了幾天功夫, 又與朋友討論一番, 總算給出了以下的論證。

2. 抽籤是公平的

首先回顧條件機率的乘法原理的一般形式 :

引理 1: 設 $E_1, E_2,\ldots,E_n$ 為樣本空間中的 $n$ 個事件, 若 $P(E_1\cap E_2\cap \cdots \cap E_n)\gt 0$, 則 $$P(E_1\cap E_2\cap \cdots \cap E_n)=P(E_1)\cdot P(E_2 \mid E_1)\cdot P(E_3 \mid E_1\cap E_2)\cdots P(E_n \mid E_1\cap E_2\cap \cdots E_{n-1}).$$ 現在進行以下假設 : 籤筒中共有 $n$ 支籤 $(n\ge 1)$, 其中 $k$ 支有獎 $(1\le k\le n)$, 今有 $p$ 個人依序來抽籤 $(1\le p\le n)$, 抽後不放回, 命第 $i$ 個人 $(1\le i\le p)$ 中獎的事件為 $A_i$。

再由逐步淘汰原理不難得 \begin{eqnarray*} P(A_i)&=&P(A_1\cap A_2\cap A_3\cap \cdots \cap A_{i-1}\cap A_i)\\ &&+P(A_1^c\cap A_2\cap A_3\cap \cdots \cap A_{i-1}\cap A_i)\\ &&+P(A_1\cap A_2^c\cap A_3\cap \cdots \cap A_{i-1}\cap A_i)\\ &&+P(A_1\cap A_2\cap A_3^c\cap \cdots \cap A_{i-1}\cap A_i)\\ &&+\cdots\\ &&+P(A_1\cap A_2\cap A_3\cap \cdots \cap A_{i-1}^c\cap A_i)\\ &&+P(A_1^c\cap A_2^c\cap A_3\cap \cdots \cap A_{i-1}\cap A_i)\\ &&+P(A_1^c\cap A_2\cap A_3^c\cap \cdots \cap A_{i-1}\cap A_i)\\ &&+P(A_1^c\cap A_2\cap A_3\cap A_4^c\cap \cdots \cap A_{i-1}\cap A_i)\\ &&+P(A_1^c\cap A_2\cap A_3\cap A_4\cap A_5^c\cap \cdots \cap A_{i-1}\cap A_i)\\ &&+P(A_1^c\cap A_2\cap A_3\cap \cdots \cap A_{i-1}^c\cap A_i)\\ &&+\cdots\\ &&+P(A_1^c\cap A_2^c\cap A_3^c\cap \cdots \cap A_{i-1}^c\cap A_i). \end{eqnarray*} 根據引理 1 有 \begin{eqnarray} P(A_i)&=&P(A_1)\cdot P(A_2 \mid A_1)\cdot P(A_3 \mid A_1\cap A_2)\cdots P(A_i \mid A_1\cap A_2\cap \cdots \cap A_{i-1})\nonumber\\ &&+P(A_1^c)\cdot P(A_2 \mid A_1^c)\cdot P(A_3 \mid A_1^c\cap A_2)\cdots P(A_i \mid A_1^c\cap A_2\cap \cdots \cap A_{i-1})\nonumber\\ &&+P(A_1)\cdot P(A_2^c \mid A_1)\cdot P(A_3 \mid A_1\cap A_2^c)\cdots P(A_i \mid A_1\cap A_2^c\cap \cdots \cap A_{i-1})\nonumber\\ &&+P(A_1)\cdot P(A_2 \mid A_1)\cdot P(A_3^c \mid A_1\cap A_2)\cdots P(A_i \mid A_1\cap A_2\cap A_3^c\cap \cdots \cap A_{i-1})\nonumber\\ &&+\cdots\nonumber\\ &&+P(A_1^c)\cdot P(A_2^c \mid A_1^c)\cdot P(A_3 \mid A_1^c\cap A_2^c)\cdots P(A_i \mid A_1^c\cap A_2^c\cap \cdots \cap A_{i-1})\nonumber\\ &&+P(A_1^c)\cdot P(A_2 \mid A_1^c)\cdot P(A_3^c \mid A_1^c\cap A_2)\cdots P(A_i \mid A_1^c\cap A_2\cap A_3^c\cap \cdots \cap A_{i-1})\nonumber\\ &&+\cdots\nonumber\\ &&+P(A_1^c)\cdot P(A_2^c \mid A_1^c)\cdot P(A_3^c \mid A_1^c\cap A_2^c)\cdots P(A_i \mid A_1^c\cap A_2^c\cap \cdots \cap A_{i-1}^c).\label{1} \end{eqnarray} 在 \eqref{1} 式中要留意不同的 $(i,k)$ 組合會使得上式中部分的集合為空集合。 例如當 $n=10$, $k=5$, $i=9$ 時, 有 $$P(A_1^c)\cdot P(A_2^c \mid A_1^c)\cdot P(A_3^c \mid A_1^c\cap A_2^c)\cdots P(A_9 \mid A_1^c\cap A_2^c\cap \cdots \cap A_8^c)=0,$$ 這是因為如果前 8 個人完全都不中獎, 那麼算上現在確定中獎的第 9 人, 再加上可安排中獎的第 10 人, 這樣中獎的人也才 2 人而已, 與前提相違。 換句話說, 由鴿籠原理 (Pigeonhole principle) 可知前 8 人之中至少有 3 人會中獎, 從而在事件 $A_1^c,A_2^c,A_3^c,\ldots,A_8^c$ 當中至少有 3 個事件為空事件。 所以在進行具體計算時, 要根據不同組合的 $(i,k)$來討論。

針對不同組合的 $(i,k)$ 進行討論時, 我著眼於無獎籤的數量是否充足, 得出了以下 4 類情況。

2.1. $i\le k$ 時

2.1.1. 無獎籤充足的情況

$k$ 支中獎籤中拿取 1 支給第 $i$ 人後, 剩下 $k-1$ 支有獎籤。 由 $i\le k$ 得 $i-1\le k-1$, 這意味著有獎籤的數量是充足的, 能夠讓前 $i-1$ 人全部都中獎。 無獎籤此時有 $n-k$ 支。 如果 $n-k\ge i-1$, 也就是對於前 $i-1$ 人而言, 無獎籤的數量也是充足的, 那麼前 $i-1$ 人的中獎與不中獎人數的分佈情況如下表 1 所示 :

表 1: $i\le k$, 且無獎籤充足時的中獎/不中獎人數分佈情況

中獎人數不中獎人數
$i-1$0
$i-2$1
$i-3$2
$\vdots$$\vdots$
2$i-3$
1$i-2$
0$i-1$

從而由 \eqref{1} 可得出 \begin{eqnarray*} P(A_i)&=&\frac kn \cdot \frac{k-1}{n-1}\cdots \frac{k-(i-2)}{n-(i-2)}\cdot \frac{k-(i-1)}{n-(i-1)}\\ &&+\left[\frac{n-k}{n}\cdot \frac k{n-1}\cdots \frac{k-(i-3)}{n-(i-2)}\cdot \frac{k-(i-2)}{n-(i-1)}\right] \cdot{{i-1}\choose 1}\\ &&+\left[\frac{n-k}n\cdot \frac{n-k-1}{n-1}\cdot \frac k{n-2}\cdots \frac{k-(i-4)}{n-(i-2)}\cdot \frac{k-(i-3)}{n-(i-1)}\right]\cdot{{i-1}\choose 2}\\ &&+\cdots+\frac{n-k}n\cdot \frac{n-k-1}{n-1}\cdots \frac{n-k-(i-2)}{n-(i-2)}\cdot \frac k{n-(i-1)}\\ &=&\frac{(n-i)!}{n!} \sum_{j=0}^{i-1}{ {i-1}\choose j}\frac{(n-k)!}{[(n-k)-j]!}\frac{k!}{[k-(i-j)]!}\\ &=&\frac{(n-i)!}{n!} (i-1)!k\sum_{j=0}^{i-1}{ {(n-1)-(k-1)}\choose j}{ {k-1}\choose {(i-1)-j}}\\ &=&\frac{(n-i)!}{n!} (i-1)!k{{n-1}\choose {i-1}}=\frac kn; \end{eqnarray*} 這裡的計算用到了組合恆等式 $ \displaystyle{n\choose k}=\sum\limits_{j=0}^k \displaystyle{{n-m}\choose j}\displaystyle{m\choose {k-j}}$。

2.1.2. 無獎籤不足的情況

如果 $n-k\lt i-1$, 也就是對於前 $i-1$ 人而言, 無獎籤的數量是不足的, 那麼前 $i-1$ 人的中獎與不中獎人數的分佈情況如下表 2 所示 :

表 2: $i\le k$, 且無獎籤不足時的中獎/不中獎人數分佈情況

中獎人數不中獎人數
$i-1$0
$i-2$1
$\vdots$$\vdots$
$i-k-n-1$$n-k$

仿照 2.1.1 的討論, 此時必須修改和式的上限為 $n-k$, $$P(A_i)=\frac{(n-i)!}{n!}\sum_{j=0}^{n-k} {{i-1}\choose j} \frac{(n-k)!}{[(n-k)-j]!}\frac{k!}{[k-(i-j)]!}.$$ 同 2.1.1 的計算一樣可得 $P(A_i)=\dfrac{k}n$。

2.2. $i\gt k$ 時

2.2.1. 無獎籤充足的情況

首先分析有獎籤數量是否充足。 由 $i\gt k$ 得 $k-1\lt i-1$, 這意味著對於前 $i-1$ 人而言有獎籤的數量是不足的。 接著來分析無獎籤的數量。 現在假設無獎籤是充足的, 也就是有 $n-k\ge i-1$, 那麼前 $i-1$ 人的中獎與不中獎人數的分佈情況如下表 3 所示 :

表 3: $i\gt k$, 且無獎籤充足時的中獎/不中獎人數分佈情況

中獎人數不中獎人數
$k-1$$i-k$
$k-2$$i-k+1$
$\vdots$$\vdots$
$1$$i-2$
$0$$i-1$

仿照前文討論, 修改和式的上、 下限, 幾乎完全相同的計算, 得 $$P(A_i)=\frac{(n-i)!}{n!}\sum_{j=i-k}^{i-1} {i-1\choose j} \frac{(n-k)!}{[(n-k)-j]!}\cdot \frac{k!}{[k-(i-j)]!}=\frac kn.$$

2.2.2. 無獎籤不足的情況

對於無獎籤不足的情況, 此時 $n-k\lt i-1$, 那麼前 $i-1$ 人的中獎與不中獎人數的分布情況如下表 4 所示 :

表 4: $i\gt k$, 且無獎籤不足時的中獎/不中獎人數分佈情況

中獎人數不中獎人數
$k-1$$i-k$
$\vdots$$\vdots$
$i-n+k$$n-k-1$
$i-1-n+k$$n-k$

仿照前文討論, 修改和式的上下限, 幾乎完全相同的計算, 得 $$P(A_i)=\frac{(n-i)!}{n!}\sum_{j=i-k}^{n-k} {i-1\choose j} \frac{(n-k)!}{[(n-k)-j]!}\cdot \frac{k!}{[k-(i-j)]!}=\frac kn.$$

3. 結論

綜合以上討論, 我們利用了條件機率的觀點得到了

定理 1: 若籤筒中共有 $n$ 支籤 $(n\ge 1)$, 其中 $k$ 支有獎 $(1\le k\le n)$, 今有 $i$ 個人依序來抽籤, 則每一人中獎的機率都相同, 皆為 $\dfrac kn$。

致謝

本文寫作過程中, 感謝任教於金門高中的好友許淵智老師共同討論, 也感謝師大數學系許志農教授撥冗幫筆者查看計算手稿。 最後感謝筆者的學生周采妮、張紋綺以及李依淳協助斧正文稿錯字與文句。

參考資料

PTT 軍旅版, [閒聊] 抽籤機率https://www.ptt.cc/bbs/SMSlife/M.1403229694.A.CC2.html 李虎雄等。 高中數學 2。 康熹文化, 2012年。 林福來等。 高中數學 2。 南一書局, 2012年。 游森棚主編。 高中數學 2。 翰林出版, 2017年三版。 許志農主編。 高中數學 2。 龍騰文化。 林信安。 高中數學上課講義。 第 2 冊, 3-3 條件機率與貝氏定理 http://math1.ck.tp.edu.tw/

---本文作者任教於台北鵬展文理補習班, 主持網路數學部落格【宇宙數學教室】---