35203 認識機率
認識機率

1. 前言

1987年, 是印度傳奇數學家拉曼努揚(Srinivasa Ramanujan, 1887-1920) 的百年誕辰。 為了紀念他, 有一系列的活動。 當代著名統計學者,出生於印度的勞氏(C. Radhakrishna Rao, 1920- ), 也應邀做了三場演講。 之後, 印度統計學研究所(Indian Statistical Institute) 基於勞氏的演講稿, 於1989年, 為他出版了統計與真理一書。 此書於1997年發行第二版。

在第一版的序文中, 勞氏提到: 學生時代, 我主修數學---一種從給定前提下演繹結果的邏輯(the logic of deducing consequences from giving premises)。 後來我唸統計學---一種從經驗中學習的理性方法, 及從給定的結果驗證前提的邏輯(a rational approach to learning from experience and the logic of identifying the premises given the consequences)。 我已認識到數學及統計, 在人類為提昇自然知識, 及有效管理日常事務, 所做的一切努力中, 佔有重要性。 我相信:

在最終的分析中, 所有知識皆為歷史。
在抽象的意義下, 所有科學皆為數學。
在理性的世界裡, 所有判斷皆為統計。

這一段話, 大致說明數學及統計的重要性, 及其各自的內涵。

長期以來, 高中數學均涵蓋機率的題材,其中古典機率(即以" 相同的可能性" 來解釋機率) 又佔不小比例。 因此機率常與排列組合連在一起。 而排列組合是較 " 數學的" 。 雖然學生有時會被那些複雜的題目, 弄得昏頭轉向。 但那只是技巧性方面, 在認知方面, 大抵沒太大迷惑。 近年來, 鑑於統計學的重要性, 高中數學裡, 逐漸加進統計的題材。 這其中 95學年開始實施的" 普通高級中學數課程綱要" 中, 新增的信賴區間與信心水準, 卻帶給師生不小困擾。 此新加入的統計題材, 由於需取樣, 得到數據, 使機率論裡" 隨機性" 的特質顯現出來。 而隨機性與傳統數學中特有的" 必然性" , 乃完全不同的概念。 可參考黃文璋(2005a)一文。 雖有人認為機率與統計, " 這類數學所需的前置準備不多" , 因此提前教沒問題。 但隨機性的概念, 在理解層次上, 其實並不是那麼容易能掌握。

翻開統計史, 信賴區間, 是另一著名統計學者, 出生於波蘭, 1938年才移民至美國的奈曼(Jerzy Neyman, 1894-1981。 他是我的師祖, 即我指導教授的指導教授), 於1934年演講中首度提出。 他的演講結束後, 大會主席包雷(Arthur Lyon Bowley, 1869-1957) 於致詞中提到, " 我不很確定此信心不是一信心戲法" (I am not all sure that the " confidence" is not a " confidence trick" )。 要知奈曼信賴區間的概念剛提出時, 大部分的統計學者, 包括被視為是現代統計學之創始者, 英國的費雪(Sir Ronald Aylmer Fisher, 1890-1962, 常以 R. A. Fisher稱之)均難以接受。 在所謂95%信賴區間中, 那95%究竟是指什麼? 是機率嗎? 如果是, 那又是什麼的機率? 雖奈曼取巧地以信賴區間, 來稱呼此一他創造出來的東西, 而避用機率一詞。 但包雷及其同行, 當然一眼便看穿這個手法 (Bowley and others easily saw through this transparent ploy)。 這段過程, 可參考 Salsburg (2001) Chapter 12(但該書中的 A. L. Bowley應該是 G. M. Bowley), 及 Sawilowsky (2003) 一文。

歲月匆匆, 七十多年過去了, 今日統計學家, 當然已完全弄懂信賴區問的意義。 只是在大學裡, 不論在機率與統計、 統計學, 及數理統計等教科書中, 信賴區間通常屬於後半部的題材。 也就是大學生在相關的課程中, 開始接觸信賴區間時, 大致上已有相當夠的機率統計基礎。 如今此題材卻獲數學家青睞, 繼95課綱加入後, 98課綱(後改為99學年度起逐年實施)仍保留此題材。 但由於缺乏足夠的預備知識, 高中生吸收不易, 乃可預期。

為何此" 有點深度" 的題材, 卻能堂而皇之地進入高中數學教材? 猜想主要原因是其重要性。 這只要看到媒體上, 常刊載各種調查結果的信賴區間, 及信心水準, 便可了解。

在有些統計教科書裡, 信賴區間佔一章的份量。 對不同的參數, 不同的分佈, 可有不同的信賴區間; 即使同一參數且同一分佈, 也可以不同的方法, 得到不同的信賴區間。 有時因條件不足, 或計算複雜等原因, 只好退而求其次, 得到近似的信賴區間。 當然這時需要一些條件, 及利用一些定理。 信賴區間亦可比較優劣。 要知統計裡有各種推論方法, 但因處理的是隨機現象, 少有倚天既出, 誰與爭鋒的方法。 而評比時, 也要訂出評比準則。 否則就像有個停止不動的鐘, 及一每日慢1分鐘的鐘, 如何判定何者較準? 前者可是每日皆有完全準確的時刻, 後者卻是每1,440天(一天有1,440分), 才有一完全準確的時刻。 不講清楚如何評比, 將會各說各話。

在98課綱, 附錄3.3" 常態分布, 信賴區間與信心水準的解讀" 中說:

高中程度的統計推論只做隨機變數期望值的估計, 它的背後理論是中央極限定理。 要介紹中央極限定理, 就需引入常態分布。 此部分僅做通識性的介紹, 以活動方式建立學生對於中央極限定理的直觀。 對一固定的信心水準, 給出信賴區間公式, 再讓學生以亂數表模擬或實驗投擲正面出現機率為 $p$ 的銅板 $n$ 次, 代入信賴區間公式, 以說明信心水準的意涵; 並以此解讀, 何以大多數學生所得的信賴區間都會涵蓋 $p$? 這段" 解讀" 不但有若干問題, 也沒能說明白。 如第一句中" 它的背後理論是中央極限定理" , 便不知從何而生? 此非統計學裡的看法。 由於課綱中的解讀晦澀不明, 那些認真教學, 想將學生教懂的高中數學教師, 只好鑽研其中原理, 各自解讀。 有些還提出自認能" 釐清這些概念" 的文章。 只是其解讀, 往往仍失之精準。

為何信賴區間的概念, 常會淪於類似郢書燕說的下場? 追根究底, 還是不少學習者, 未能正確了解機率的涵意。 這是本文寫作的動機。

2. 機率的意義

一骰子有6個面, 一擲之下, 會得到偶數之機率為何? 骰子看起來沒有異樣, 就假設每個面出現的機率皆相同, 即均為1/6。 而偶數面有2, 4, 及6等3個。 因此所求之機率為3/6。 這就是所謂古典的機率, 基本假設是" 相同的可能性" 。 先求出觀測的現象共有幾種可能, 再求出其中有幾件是我們有興趣的。 將後者除以前者, 即為所要的機率。 雖說是" 古典" , 這種機率的意義, 至今仍處處可見。 採用的範圍包含諸如抽籤、 玩撲克牌, 及玩樂透彩等。 又如某項工作徵才, 報名的有82人, 錄取5人。 若沒有什麼特別的資訊, 便只能假設每人被錄取的機率皆相同, 即皆為5/82。

2009年7月底8月初, 世界高爾夫球王老虎伍茲(Tiger Woods), 參加在美國密西根州舉行的別克公開賽(Buick Open)。 第1輪打完, 落後領先者多達8桿, 排名並列95。 引發他可能難逃職業生涯, 首次連續2場比賽(前一場是英國公開賽(The Open Championship, 在英國之外常稱為British Open)), 提前被淘汰的話題。 不過老虎畢竟不能小覷, 打完前3輪後, 伍茲躍居首位。 這時大家看法丕變, 一致認為這座冠軍盃, 幾乎可說是他的囊中物了。 因過去的紀錄顯示, 伍茲如能帶著54洞領先進入決賽圈, 戰績是35勝1敗。 你要不要猜後來他贏了沒有? 運動比賽, 往往有過去資料可參考, 此時相同的可能性便不宜用了。 36次中成功35次, " 相對頻率" 為35/36(約0.972)。 這種以相對頻率來解釋機率, 是常有的作法。 適用能重複觀測的現象。 會不會有爆出冷門的時候? 當然有。 只是對一特定事件, 用過去多次同樣情況下, 該事件發生的相對頻率, 來估計下一次事件發生的機率, 乃是在沒有更多資訊下, 常被認為一屬於客觀的辦法。

某君看上一女孩, 驚為天人, 覺得這是他今生的新娘。 評估後信心滿滿, 自認追上的機會有8成。 旁人卻都不看好, 問他8成這一數字, 是如何冒出來的? 該君舉證歷歷, 一個又一個的跡象, 顯示那女孩對他很有好感。 這個0.8的機率, 就是所謂主觀機率。 主觀機率當然也可基於過去一些客觀的事實。 只是即使面對同樣的資料, 不同的人, 可能有不同的判定, 因而給出不同的主觀機率(看過他其實沒那麼喜歡妳(He's Just Not That Into You)嗎? 片中那個叫Gigi的女孩, 便常誤解男生所透露的訊息)。 有些現象就是不能重複觀測。 如核能電廠的意外, 及彗星撞地球等。 以追女孩為例, 大約少有女孩, 會讓你做實驗, 反覆地追, 然後數一數其中成功幾次, 來定下她會被你追上的機率。 對這類無法重複觀測的現象, 在談機率時, 主觀機率就常派上用場。 每天早上出門, 我們不是慣於抬頭看天, 判斷一下今天下雨的機率有幾成? 只是往往父母認為的機率會大些, 該帶傘, 而小孩所認為的下雨機率會小些。

雖說" 主觀" , 但仍要合理。 例如, 考試有及格與不及格。 若認為會及格的機率為0.9, 這沒問題, 人總要有點自信, 但若又同時擔心有0.8的機率會不及格, 那就不行了。 各種可能性發生機率相加要為1。 即使是主觀, 可以獨排眾議, 仍須自圓其說。 不能說, 既然是主觀, 便可以任意自定各事件之機率。 因此不論是那一種對機率的解釋, 都自然地, 或說必須要滿足一些共同的規則。 這點大家應能理解。

上述三種是常見對機率的解釋, 大抵也就是人們評估事件發生可能性之大小的幾種思維。 雖是針對不同的情況, 但常能交互著運用。 大家都聽過曾參殺人的典故吧! 有個與曾子同名的人殺人, 好心者告訴曾母" 曾參殺人" 。 曾母說" 吾子不殺人" , 繼續織布。 過一會兒, 又有人來說" 曾參殺人" 。 曾母仍繼續織她的布, 這麼好的兒子怎可能殺人? 但當第三人跑來說" 曾參殺人" , 曾母就害怕了, 丟掉織布器具翻牆而逃。 所謂" 其母懼, 投杼踰牆而走" 。 這故事出自戰國策秦策二。 因此當拿到一銅板,可主觀地認為, 政府發行不該會有偏差, 兩面出現的機率, 應皆為1/2(這也可以是基於相同可能性之想法)。 若投擲10次, 正面出現8次, 可能覺得有些奇怪。 若繼續投擲, 結果100次中, 出現80個正面, 這時相對頻率的觀點, 很可能便將顯現。 類如曾母, 調整看法, 不再認為此銅板公正。

當然, 你可以不信邪, 不論投擲的結果如何, 皆認為那只是短暫的情況, 意志堅定地認為這是一公正的銅板。 這並沒有不行, 就像會有母親, 即使再多的人證, 只要她沒親眼看到, 她就不信兒子會殺人。 要知隨機現象, 事件只要機率為正, 不論機率值多小, 便皆可能發生。 畢竟銅板正面出現的機率為何, 只有天曉得。 但引進機率與統計, 乃為了協助我們做決策可以更精準。 而決策可以與時推移, 並非不能更改。 有如氣象局對颱風會帶來多少雨量, 須密切掌握新的動向, 而隨時修正。 要有隨機的思維, 如前言中勞氏所說的, 從給定的結果, 驗證前提。 因此針對100次投擲, 出現80個正面, 多數人面對此結果, 還是會認為0.8的正面出現機率, 較0.5的機率可信。 稍後我們會再來看, 10次中的8次, 與100次中的80次, 相對頻率同為0.8, 但提供的資訊, 是否有異?

雖然已有上述三種對機率的解釋, 也涵蓋了不少實際生活中所遇到的情況, 數學家當然不會在此止步。 他們喜歡抽象化, 及一般化。 像解方程式, 會尋求公式, 以表示出某類方程式的解, 而非只滿足於求出一個個的特例之解。 又如當完全了解實數系統後, 便會以公理化的方式, 定義實數系統。 即給一集合, 沒說是數字的集合, 對其中的元素定義二運算, 並給出10條遵循的公理(axiom, 規則)。 你好奇該二運算是否一為加法, 一為乘法? 而怎麼沒有減法與除法? 名可名, 非常名, 數學家不認為你提出的是重要的問題。 但用心體會後, 你終於發現原來二運算, 其一等同於加法, 其二等同於乘法。 也看出此集合中, 有一元素根本就是0, 而有一元素根本就是1。 數學家對你的洞察力, 仍不以為意, 但同意你可以這樣想。

什麼叫以公理化的方式, 來引進機率? 先要有一個集合, 稱做樣本空間, 當做某一觀測之所有可能結果的集合。 可以真的有這一觀測, 或只是虛擬的。 樣本空間的某些子集合, 是我們有興趣的, 這些就是一個個的事件。 所有事件也構成一集合。 最後定出一機率函數, 即對每一事件, 給一介於0, 1間的值, 為該事件之機率。 樣本空間、 事件的集合, 及機率函數, 三者便構成機率空間 (probability space)。 這其中對樣本空間沒有太大要求, 但不可以是空集合。 而事件的集合, 要滿足若干條件。 簡單講, 就是你有興趣的事件不能太少。 譬如說, 不能只對某事件 $A$ 發生有興趣, 卻對$A$不發生沒興趣。 因此事件的集合要夠大, 至少該有的都得納入。 這有點像婚宴前擬賓客名單。 可以請很少人, 如只有雙方家長。 而一旦多列了某人, 與他同樣親近的人便也要一併請。 所以每多列1人, 將不只是增加1人而已, 而會隨之增加幾位。 又機率函數, 既然以機率之名, 當然要符合過去大家對機率的認知, 滿足一些基本的條件。 機率空間的定義, 可參考黃文璋 (2010b)。

在機率空間的架構下, 不論採用何種方式解釋機率的人, 都可各自表述, 找到他所以為的機率意義。 但因抽象化後, 不再局限於銅板、 骰子, 及撲克牌等, 便能討論較一般的問題, 有夠多的理論可挖掘。

與數學的其他領域相比, 機率論的發展是較晚的。 但公理化後, 機率論便快速地有了深而遠的發展, 並成為數學中一重要的領域。 這都要歸功於二十世紀那位重要的機率學家, 俄國的科莫果洛夫 (Andrey Nikolaevich Kolmogorov,1903-1987), 於他 1933 年出版, 那本不到100頁的小書機率論的基礎(Foundations of the Theory of Probability)中所奠定。 在此書中, 他說:

機率論作為數學學科, 可以而且應該從公理開始發展, 就如同幾何、 代數一樣(The theory of probability as mathematical discipline can and should be developed from axioms in exactly the same way as Geometry and Algebra)。

3. 何處是機率天地

有法國牛頓之稱的拉普拉斯(Pierre-Simon, Marquis de Laplace, 1749-1827) 曾說:

這門源自考慮賭博中的機運之科學, 必將成為人類知識中最重要的一部分, 生活中最重要的問題中的大部分, 都將只是機率的問題(This science, which originated in the consideration of games of chance, should have become the most important object of human knowledge. The most important questions of life are, for the most part, really only problems of probability)。

機率是針對隨機現象。 但世上並非每件事都是隨機的, 我們說過還有必然性。 假設投擲一兩面皆是人頭的銅板, 並觀察會得到那一面。 你曉得這是一必然現象, 但仍可說會出現人頭的機率為1, 而其他情況出現的機率為0。 也就是視此為一" 退化的" 隨機現象。

某些物理學家, 說不定認為對投擲銅板, 由給定投擲的速度、 角度、 地面的彈性、 銅板的形狀及重量等條件, 可算出銅板落地後, 會那一面朝上, 因此這不是隨機。 至於樂透彩的開獎, 只要起始條件都能測出, 則會開出那一號球, 也能算出, 因此這也不是隨機。 但你大約也知道所謂蝴蝶效應(butterfly effect)。 量測極可能有誤差, 而有時一些微小的改變, 影響卻可能很大。 因此我們寧可相信這些都是隨機現象。

某些神學家, 可能認為一切其實都是按照神的旨意在進行, 只是我們不知而已。 說不定真是如此。 你看過傑遜王子戰群妖(Jason and the Argonauts)嗎? 這是一部基於希臘神話的電影, 內容與十二星座中的牡羊座有關, 1963出品。 我雖是幼時看的, 至今仍印象深刻。 片中傑遜王子遭遇的各種突如其來的災難, 以及一次又一次英勇的逢凶化吉, 不過是天后赫拉(Hera), 與天神宙斯(Zeus) 在較勁, 分別作梗及協助。 但若無從了解神的旨意, 對於未來, 也只好視為隨機。

隨著科技進步, 人們逐漸弄明白很多現象的來龍去脈。 例如, 我們知道女性一旦懷孕, 嬰兒性別便已確定。 但對一大腹便便的婦女, 好事者由於不知, 仍可猜測其生男生女之機率。 考試前夕, 學生們雖認真準備, 但還是絞盡腦汁猜題, 各有其認為考出機率很大的題目。 老師獲知後, 覺得好笑。 課堂中已一再暗示明示, 那些題會考, 幾乎都該能確定了, 何需再猜? 實則試題早已印妥, 而學生不知考題, 且未體會老師的暗示及明示, 所以仍可以大猜一通。 另外, 諸如門外有人敲門, 你好奇是男是女? 老師要你猜拿在背後的水果, 是橘子或蘋果? 同學蓋住落地的銅板, 要你猜正面或反面朝上?這類明明已確定的事, 本身其實並不隨機, 只是對你而言, 卻有如惠子在秋水篇所說的" 子非魚" , 當然可猜魚快樂的機率。

但對已命好題目的老師, 去判斷那一題會考出的機率, 就沒什麼意義了。 因對他而言, 每一題會考出的機率, 只有1或0, 不會是其他值。 同樣地, 對看到背後水果的人, 水果會是橘子或蘋果的機率, 將只能說1或0。 隨機與隨意不同。 我們說過了, 機率中那套邏輯, 是有夠大的彈性, 讓人能揮灑, 只是仍要合理, 否則就是抬槓了。 若你明明知道那是蘋果, 硬要說它是橘子的機率為0.5; 或明明已從醫生處掌握一切訊息的待產媽媽, 還說生下來, 是男是女的機率皆為0.5, 那就不是在談機率了。

4. 解釋機率

在第2節我們以機率空間的方式引進機率。 由於樣本空間可以是虛擬的, 此時事件也就是虛擬的。 但假設真的有一項觀測, 如投擲一個4面體, 4面分別標示點數1, 2, 3, 4, 並觀測所得點數。 則樣本空間為1, 2, 3, 4之集合。 事件的集合可以取那一個最大的, 也就是包含樣本空間之所有子集所構成的集合。 你如果學過排列組合, 便知此最大的事件集合中, 共有16(2的4次方)個元素。 至於機率函數, 假設點數1, 2, 3, 4出現的機率, 分別為0.1、 0.2、 0.3, 及0.4, 相加為1。 至於任一事件的機率, 就看該事件包含1, 2, 3, 4中那幾個數, 再把對應的機率相加便是。 如一事件中恰包含2, 4, 則該事件的機率為0.2+0.4=0.6。 餘此類推。 這就建立了一機率 空間。 對同一樣本空間, 可定義出很多不同的機率空間。

就算你已接受了機率空間的概念, 反正數學家就是常給一些自得其樂的定義, 仍可能會好奇, 所謂點數1出現的機率0.1, 究竟是什麼意思? 是每投10次, 點數1恰出現1次嗎? 非也! 有個修過機率論的數學系畢業生, 好心地對你解釋如下:

假設投擲 $n$ 次, 點數 1 出現 $a$ 次, 則相對頻率 $a/n$ 與 0.1 之差的絕對值, 會大於一給定的正數(不管它多小)之機率, 將隨著 $n$ 的趨近至無限大, 而趨近至0。

務實的你, 很可能不覺得這樣的解釋很實際。 先提出疑問" 什麼是趨近至無限大?" 就是一直投擲, 不可停止, 日出日落, 春去秋來, 繼續投擲, 即使夸父追日成功了, 無限大也仍未達到, 還得投擲。 那位數學系畢業生, 一聽到你問起無限大, 如魚得水, 這是他在數學系四年寒窗, 學到的幾招獨門絕活之一。 你不得不停止無限大這個話題, 因連夸父追日, 你也覺得豈有成功時? 如何能接受解釋機率, 還得涉及無限大? 但還一點你不吐不快的是" 我就是不了解機率值的意義, 怎麼卻用機率的概念來解釋給我聽?"

想解釋機率值的意義, 將會在機率及無限大, 一層又一層的打轉。 這有如想去定義什麼叫做點, 結果將如同陷在線團中, 學步維艱。 最後只好說, 點是無定義名詞。 但無論如何, 你應可理解, 對前述4面體, 僅投擲1次, 是無法顯示點數1出現機率0.1, 那個0.1的意思。 機率並非只看" 少數幾次" 的結果。 機率是在大樣本 ($n$ 很大) 下, 威力才顯現。 機率值的意義, 既然不能以一套可接受的邏輯來說明。 那麼退而求其次, 可否讓人略微了解機率值的意思? 或者說(除非是虛擬, 只是在求一些機率值), 你拿一4面體, 且宣稱點數1出現的機率為 0.1, 怎麼樣才知道你講的是真的, 而非信口開河, 或者說記錯。

之前那位數學系畢業生的解釋, 這時便能派上用場。 此即大數法則(law of large numbers)之一簡單的版本。 數學上的意思為, 事件出現的相對頻率, 會" 機率收斂" 至事件發生的機率。 要知隨機世界中, 仍有些法則要遵循, 大數法則是其中很重要的一個。 當然我們已指出了, 實際上並無法觀測事件無限多次。 那是否可說, 事件出現的相對頻率, 當觀測數夠大, 須接近事件發生的機率? 也非如此。 事件只要機率為正, 便都可能發生。 所以, 不論觀測數再大, 都不能排除很偏頗(如觀測 1,000,000 次, 點數1出現的次數為0, 或 1,000,000 次)的事件發生。 但是, 這時統計學家跳出來了, 可以做一檢定, 檢定點數1出現的機率是否真為0.1, 這是屬於統計學裡假設檢定(testing hypothesis)的範疇。 簡單講, 是以在某一假設下, 會觀測到這樣的結果, 是否算不尋常? 所謂不尋常, 是指發生的機率很小, 小於某一預設的值。 若屬於不尋常, 則當初的假設就不宜接受。 附帶一提, 當假設一銅板為公正, 則投擲100次, 出現至少80次正面, 較投擲10次, 出現至少8次正面, 前者是更不尋常的, 因它發生的機率, 遠比後者小。 所以, 在同樣獲得八成以上的正面數下, 投擲數愈大, 將會使我們更相信此銅板非公正, 而接受它出現正面的機率, 至少是0.8。 這說明在統計裡, 樣本數愈大, 將使我們的推論愈精準。 假設檢定進一步的討論, 可參考黃文璋(2005b)一文。

在隨機世界, 究竟何者為真, 常屬未知。 我們往往無法" 證明" 那件事是真實的。 不過是一個個的假設, 端看你接受那一假設。 4面體點數1出現的機率, 是否真為0.1, 即使投擲再多次, 都無法證明其真偽。 只能說數據顯示" 可以接受" , 或" 無法接受" 機率為0.1。 這裡面有一套機制, 以決定接受或不接受。

另外, 對一4面體, 也可估計點數1出現的機率, 有一些不同的估計法, 可以得到不同的估計量。 在數學中, 使用不同的方法, 須導致相同的結果。 所謂殊途同歸。 但統計裡, 除非做些限制, 否則常無定於一尊的方法。 對不可測的未來, 我們常要做估計, 統計在這方面, 能扮演很好的角色。 可參考黃文璋(2007)一文。 諸如銅板出現正面的機率, 及病人的存活率等, 皆能估計。 但有時覺得以一個值估計, 雖然明確, 但估計值很難恰好等於真實值, 一翻兩瞪眼, 常估計不準。 下節信賴區間的概念, 因而產生。

5. 信賴區間

我們常對某一未知的量做估計。 未知的量可以是某事件發生的機率, 某分佈的參數(如期望值及變異數等), 或某物件之壽命等。 這些未知的量, 可通稱為參數。 有時會以一區間來估計參數, 並給出此區間會涵蓋該參數之機率。 這就是所謂區間估計, 所得的區間, 稱為信賴區間。 而區間涵蓋參數之機率, 則稱為此區間之信心水準(confidence level)。 與機率一樣, 信心水準是一介於0, 1間的值, 常事先給定, 且以百分比表示。 90%、 95%, 及99%等, 都是常取的值。

數據(data) 是統計學家做決策之主要依據。 若缺乏數據, 他們往往將一籌莫展。 來看一簡單且常見的情況。 假設欲估計一銅板出現正面之機率 $p$。 很自然地, 便投擲若干次, 譬如說 $n$ 次, 並觀測 $n$ 次的結果。 這個過程便稱為取樣。 在本情況中, 各次投擲的結果並不重要。 總共得的正面數, 以 $a$ 表之。 知道 $a$, 就已掌握全部資訊 ($a$ 稱為充分統計量(sufficient statistic))。 給定信心水準, 並利用 $n$ 及 $a$, 可得一信賴區間, 但作法並不唯一。 亦即對於 $p$, 有不同的信賴區間公式。 但課綱的寫法, 好像信賴區間的公式唯一。 此處由於其中涉及二項分佈, 計算複雜些, 如果 $n$ 夠大 ($n$ 太小則不行), 我們常可藉助常態分佈來近似。 這要用到機率論裡另一重要的法則---中央極限定理(Central limit theorem)。 必須一提, 只有以常態分佈來近似時, 才需用到中央極限定理, 並非求信賴區間皆要用到此定理。

對估計銅板出現正面之機率$p$, 取樣前, 信賴區間為一隨機區間, 若信心水準設定為95%, 則有(或精準地說"約有" , 如果該信賴區間只是近似的)0.95的機率, 信賴區間會包含 $p$。 取樣後, 得到一固定區間。 則 $p$ 會屬於該區間的機率, 將不是1便是0, 而不再是 $p$ 了。 為何如此? 很多人對此常感困惑。

我們先以下例來說明。 假設某百貨公司周年慶, 顧客購物達一定金額, 便能自 1 至 10 號中抽 1 彩球。 若抽中 5 號, 今天在該公司的花費, 可獲 30% 抵用券。 在抽球之前, 你知道有 0.1 的機率能獲抵用券, 機會不算小。 一旦抽出, 一看是 3 號, 獲抵用券的機率當然便是 0 了。

這類例子很多。 打擊手揮棒前, 可以說打出安打之機率為 0.341, 打完不是安打就非安打, 0.341 已派不上用場了。 再給一例。 假設某銀行發行的樂透彩, 每期自 1 至 42 號中, 開出6碼為頭獎號碼。 你簽了一注 6 碼, 開獎前, 你知道很容易" 至少中1碼" , 因機率約為 0.629 (見附註1)。 等開獎後, 你的彩券會至少中 1 碼之機率, 將是1(若至少中1碼), 或是0(若1碼皆未中)。

再看如課綱中所說, 也可以亂數表模擬出現正面(課綱中少了" 正面" 二字,意思便不通)機率為 $p$ 的銅板 $n$ 次, 以求得信賴區間。 你看, $p$ 根本是事先設定, 模擬所得之一固定區間, $p$ 有沒有落在其間, 一看便知, 如何能說該區間涵蓋 $p$ 之機率為0.95? 就算你不是模擬, 而是實際拿一銅板投擲, 則 $p$ 只是未知, 卻為某一定值(說不定發行銅板的單位知道), 投擲後所得之固定信賴區間, 已無隨機性了, 它只會涵蓋 $p$, 或不會涵蓋 $p$。 可以這樣想, 對同一銅板, 每人所得之 95% 信賴區間有異, 如何能個個皆宣稱, 其區間涵蓋 $p$ 之機率為 0.95?

那95%有何用? 0.95是一機率值, 而機率值從來就不是只看一次的實驗結果。 大約可以這麼說, 如果反覆實驗, 而得到很多信賴區間, 則其中會包含$p$的信賴區間數, 約佔全部區間數的95%。 所以, 0.95的意義, 乃如同上一節我們對機率的解釋。 但要留意的是, 對同一個 $p$, 如果全班 40 人, 所得到的 40 個 95% 信賴區間, 其中包含 $p$ 的個數未超過 85% (即未超過34個), 也不要太驚訝。 此機率約為 0.01388 (附註2), 是不太大, 但只要班級數夠多, 便不難發生。 98課綱說" 大多數學生所得的信賴區間都會涵蓋 $p$" , 實在缺乏隨機的概念。 有關信賴區間更多的討論, 可參考黃文璋 (2006)一文。

6. 情境解讀

機率既然與我們的生活習習相關, 因此若能善用機率, 將有助於在隨機世界中, 更精準的做決策。 只是卻往往機率應用不易, 得到的機率值, 常被認為是錯的。 而且還眾說紛紜, 各提出不同的機率值。 個中原因何在? 一主要原因, 即情境解讀有誤。

過去大家在數學課程中, 會遇到所謂應用題。 題目看懂, 寫出數學式子後, 就是解數學了。 這時便可拋開原先那段冗長的敘述。 但在機率裡, 有些看似簡單的情境, 因解讀不同, 會導致南轅北轍的結論。 底下給幾個例子來看。

在電影決勝21點(英文片名就是21)中, 那位數學教授於課堂上提出一個問題。 有3扇門, 其中1扇門後有汽車, 另兩扇門後為山羊。 你選擇第1扇門後, 主持人打開第2扇門, 見到山羊。 問你這時該不該換選第3扇門? 有位學生答:

Yes, because my chance of getting the car will increase from 33.33% to 66.67% by switching from door 1 to door 3.

教授則說" Very good!" , 認同其看法, 也就是該換。 有些人對此提出質疑。

比較正確的講法應該是, 若主持人事先知道汽車在那扇門後, 則他會打開1扇門後是山羊的門(這是較合理的作法, 否則遊戲便無法進行了), 這時若換選第3扇門, 則如電影中那位學生所述, 得到汽車的機率, 將由 1/3 增加為 2/3。 但若主持人事先不知汽車在那 1 扇門後 (這當然是少見的情況), 只是隨機地自第 2 及第 3 扇門中, 挑一扇打開, 且剛好門後是山羊, 則便不用換, 因換或不換, 得到汽車之機率, 皆為1/2。 其中推導, 可參考黃文璋 (2010a)一文之例6。

但是讀者不知是否注意到, 在主持人事先知道汽車在那一扇門後的情況中, 我們其實還隱含做一假設。 即若第2及第3扇門後皆是山羊, 則主持人乃隨機地(即各以1/2的機率)打開第2或第3扇門。 事實上, 可以有更一般的假設。 當第2及第3扇門後皆是山羊, 假設主持人分別以 $q$ 及 $1-q$ 的機率, 打開第2或第3扇門, 其中 $0\le q\le 1$。 則換選第3扇門, 得到汽車的機率成為 $1/(1+q)$(見附註2)。 原來此機率會受主持人是如何打開第2扇門的影響! 很多人可能未想到這點。 由於 $1/(1+q)\ge 1/2$, 所以換, 仍是較好的選擇。

再看一例。 有一對夫妻剛搬進某社區, 大家只知他們有兩個小孩, 並不知性別。 某日社區一管理員, 見到此家之媽媽, 帶著家中一小孩在玩耍。 若該小孩是女孩, 求此家兩小孩皆為女孩之機率。 很多人以為此問題不難, 認為所求機率就是1/3。 其實此問題比我們想像的複雜很多。 關鍵在如何將" 見到此家之媽媽, 帶著家中一女孩" , 轉化為適當機率空間中的事件。 也就是要講清楚, 究竟如何帶小孩出門? 要注意的是, 前述事件並不等同於" 此家至少有一女孩" ! 本問題之詳細討論, 可參考黃文璋(2010a)一文之例8。

最後看另一常出現於機率論教科書中的例子。 平面上有一單位圓, 隨機地畫一條弦, 求弦長大於此圓的內接等邊三角形之邊長的機率。 利用幾何, 單位圓的內接等邊三角形之邊長可求出。 但如何是隨機地畫一條弦呢? 要知由1至 $n$ 的 $n$ 個正整數中, 隨機地取1數, 其意義較清楚, 就是每一數被取中的機率皆為 $1/n$。 自區間 [0,1] 中隨機地取1數, 其意義也還明白, 就是此數會落在 [0,1] 之任一子區間的機率, 為該子區間之長度。 但隨機的畫弦, 是如何畫法? 此處對於" 隨機" 一詞, 可以有好多種解釋。 解釋不同, 畫弦的方式將不同, 因而求出的機率也就不同。 可參考黃文璋 (2010b)第二章例 5.3。

上面這幾個例子告訴我們, 在處理機率問題時, 情境要定義清楚。 用術語來說, 就是機率空間要明確給出, 否則將導致各說各話。 有時雖未給出機率空間, 但情境較簡單, 大家有共同看法, 這時未特別強調機率空間為何, 還沒問題。 如"投擲一公正的骰子, 求點數大於4之機率" 。 雖只是簡單的描述, 但不至於有疑義。 當對情境有疑義時, 就要如莊子在秋水篇講的, " 請循其本" , 把機率空間調出來。 此有如政治上或社會上, 遇到有重大爭議時, 就要祭出憲法, 看有沒違憲, 並由大法官解釋。 對一給定的情境, 要很謹慎的面對。 否則即使是機率統計專業人士, 也可能解讀錯誤。

情境解讀之外, 機率中一些獨特的概念, 像是條件機率, 獨立性, 及隨機取樣等, 也是應用機率時, 得謹慎留意的。 這類概念我們已談過不少, 可參考黃文璋(2003)一書。 至於機率與統計裡的一些基本概念, 可參考黃文璋(2009)一文。

附註.

  1. 42取6的樂透彩, 每簽一注, 至少中1碼之機率為 $$1-\frac{{36\choose6}}{{42\choose6}}=1-\frac{1,947,792}{5,245,786}\doteq0.629\hbox{。}$$
  2. 取樣前, 每一區間包含 $p$ 之機率為0.95。 故總共包含 $p$ 之區間數 $X$, 有二項分佈, 參數為40, 0.95。 因此 $$P(X\leq34)=\sum\limits_{i=0}^{34}{40\choose i}0.95^i0.05^{40-i}\doteq0.01388\hbox{。}$$ 上述值可藉查表或由計算機獲得。
  3. 在汽車與山羊問題, 你先選了第 1 扇門。 當第 2 及第 3 扇門後皆是山羊, 假設主持人分別以 $q$ 及 $1-q$ 的機率, 打開第 2 或第 3 扇門, 其中 $0\leq q\leq1$。 底下我們來求, 在給定主持人打開第 2 扇門且門後是山羊之下, 你更換選擇, 會得到汽車之機率。 令樣本空間為 $$\Omega=\{(1,2),(1,3),(2,2),(2,3),(3,2),(3,3)\},$$ 其中 $(1,2)$ 表第 1 扇門後有汽車, 且主持人打開第 2 扇門, 餘類推。 事件的集合 $\mathcal{F}$, 取為包含 $\Omega$ 之所有子集之集合。 又令機率函數 $P$ 滿足 \begin{eqnarray*} P(\{(1,2)\})&=&\frac{q}{3},~P(\{(1,3)\})=\frac{1-q}{3},\\ P(\{(2,2)\})&=&0,~P(\{(2,3)\})=\frac{1}{3},\\ P(\{(3,2)\})&=&\frac{1}{3},~P(\{(3,3)\})=0, \end{eqnarray*} 其中 $P(\{(1,2)\})=q/3$, 是因汽車在第1扇門後之機率為1/3, 且主持人有 $q$ 的機率打開第 2 扇門, 二機率相乘即得 $q/3$; $P(\{(2,2)\})=0$, 是因若汽車在第2扇門後, 主持人必定打開第 3 扇門, 餘類推。 則得機率空間 $(\Omega,\mathcal{F},P)$。 主持人打開第 2 扇門的事件為 $$A=\{(1,2),(2,2),(3,2)\},$$ 其機率為 $${q\over3} + 0 + {1\over3} = {1+q\over3}\hbox{。}$$ 更換第 3 扇門, 會得到汽車之事件為 $B=\{(3,2\}$, 其機率為 1/3。 則 $$P(B|A)={P(A\cap B)\over P(A)}={P(B)\over P(A)}={1/3\over (1+q)/3}={1\over 1+q}\hbox{。}$$ $q=1/2$, 就是原先的情況, 此時 $P(B|A)=2/3$。 至於兩個極端的情況, $q=0$ 及 1, $P(B|A)$ 分別為 1, 及 1/2。 此二情況的意義是什麼? 以及對應的 $P(B|A)$ 為何是 1 及 1/2? 就留給讀者自行想通。

參考文獻

黃文璋 (2003). 隨機思考論。 華泰文化事業股份有限公司, 台北。 黃文璋(2005a). 應隨機以恆周。 科學發展月刊, 394期(2005年10月號): 68-73。 黃文璋(2005b). 統計顯著性。 數學傳播季刊, 29(4): 29-38。 黃文璋(2006). 統計裡的信賴。 數學傳播季刊, 30(4): 48-61。 黃文璋(2007). 統計裡的估計。 數學傳播季刊, 31(2): 3-20。 黃文璋(2009). 統計思維。 數學傳播季刊, 33(4): 30-46。 黃文璋(2010a). 機率應用不易。 數學傳播季刊, 34(1): 14-28。 黃文璋(2010b). 機率論, 第二版。 華泰文化事業股份有限公司, 台北。 Neyman, J. (1934). On the two different aspects of the representative method: The method of stratified sampling and the method of purposive sampling. The Journal of the Royal Statistical Society, 97, 558-625. Rao, C. R.(1997). Statistics and Truth: Putting Chance to Work, 2nd ed. World Scientific, Singapore. (第一版有中譯本,~石堅及李竹渝譯(1998)。 統計與真理---怎樣運用偶然性。 九章出版社, 台北) Salsburg, D.(2001). The Lady Tasting Tea: How Statistics Revolutionized Science in the Twentieth Century. W.H. Freeman and Company, New York. (有中譯本, 葉偉文譯(2001)。 統計改變了世界。 天下遠見出版股份有限公司, 台北) Sawilowsky, S. S.(2003). Deconstructing arguments from the case against hypothesis testing. Journal of Modern Applied Statistical Methods, 2, 467-474.

---本文作者任教國立高雄大學應用數學系---