2017年6月 41卷2期
如何設計滿足辛普森悖論的例子
發刊日期 |
2017年6月
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
標題 | 如何設計滿足辛普森悖論的例子 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
作者 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
關鍵字 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
檔案下載 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
全文 |
一、前言筆者在數學網站昌爸工作坊(
二、探索一般來說, 仿照上面表 1, 其實我們想設計出下面的例子:
![]() 注意 $p_1,p_2$ 不能落在所在範圍的端點上, 雖然如此, 由圖 1 看來, 只要 $p_1$ 夠靠近 $y_1$ 且 $p_2$ 夠靠近 $x_2$, 是有可能發生 $p_1\lt p_2$ 的。換一個說法, 正是因為 $x_2\gt y_1$ 的條件, 使圖 1 中 $(y_2,x_2)$ 和 $(y_1,x_1)$ 兩區間有所重疊, 導致 $p_1\lt p_2$ 有可能發生。 除了從圖 1 來看, 我們也從式子來看。 因為 $x_1\gt y_1$, $x_2\gt y_2$, 表 2 中錄取率 $p_1,p_2$ 分別滿足 \begin{eqnarray} p_1&=&\frac{n_1x_1+m_1y_1}{n_1+m_1}=\frac{n_1x_1+(S-n_1)y_1}{S}=y_1+\frac{n_1(x_1-y_1)}{S}\nonumber\\ &&\Rightarrow \ p_1-y_1=\frac{n_1}S(x_1-y_1)\gt 0\label{4}\\ p_2&=&\frac{n_2x_2+m_2y_2}{n_2+m_2}=\frac{(S-m_2)x_2+m_2y_2}{S}=x_2+\frac{m_2(y_2-x_2)}{S}\nonumber\\ &&\Rightarrow \ x_2-p_2=\frac{m_2}S(x_2-y_2)\gt 0\label{5} \end{eqnarray} 在 \eqref{4} 式中的 $x_1-y_1$ 與 \eqref{5} 式中的 $x_2-y_2$ 兩者均為定值, 因此只要使 $\dfrac{n_1}S$, $\dfrac{m_2}S$ 兩數之值 任意小 (最簡單的取法就是取 $n_1=m_2=1$ 且 $S$ 儘量大), 就可使 $p_1$ 任意靠近 $y_1$ (且 $p_1\gt y_1$)、 $p_2$ 任意靠近 $x_2$ (且 $p_2\lt x_2$), 此時因為 $x_2\gt y_1$, 由圖 1 知必能得到 $$y_1\lt p_1\lt p_2\lt x_2$$ 此結果可示意如下: ![]() 眼尖的讀者,看到上面 $p_1=\dfrac{n_1x_1+m_1y_1}{n_1+m_1}$, $p_2=\dfrac{n_2x_2+m_2y_2}{n_2+m_2}$ 兩式, 或許會想到這是數線上兩點間分別按照 $n_1:m_1$ 和 $n_2:m_2$ 的比例取分點坐標 $p_1,p_2$ 的公式, 而圖 2 其實就是筆者配合表 1 的例子 ($n_1=10,m_1=30,n_2=30,m_2=10$) 而畫, 其中取區間 $(y_1,x_1)$ 的 3 個四等分點 ($n_1:m_1=1:3$) 中最左邊的點為 $p_1$, 並取區間 $(y_2,x_2)$ 的 3 個四等分點 ($n_2:m_2=3:1$) 中最右邊的點為 $p_2$。 接下來的過程, 是為了估計出兩班總人數 $S$ 至少要多大, 才能得到像圖 2 那樣的結果。 如果先給定表 2 中四個分組錄取率 $x_1,x_2,y_1,y_2$, 其中 $x_1\gt x_2\gt y_1\gt y_2$, 若存在正整數 $n_1,m_1,n_2,m_2$ 滿足 \eqref{1}, 我們會有: \begin{eqnarray} &&\hskip -25pt\frac{n_1x_1+m_1y_1}{n_1+m_1}\lt \frac{n_2x_2+m_2y_2}{n_2+m_2}\label{6}\\ &\Leftrightarrow&\frac{n_1x_1+(S-n_1)y_1}{S}\lt \frac{(S-m_2)x_2+m_2y_2}{S}\nonumber\\ &\Leftrightarrow&y_1+\frac{n_1(x_1-y_1)}{S}\lt x_2-\frac{m_2(x_2-y_2)}{S}\label{7} \end{eqnarray} 因為已知 $x_1\gt x_2\gt y_1\gt y_2$, 此時假設 \begin{eqnarray*} x_1-y_1&=&\delta\gt 0,\\ x_2-y_2&=&\ell\gt 0, \end{eqnarray*} 將上述兩式代入 \eqref{7} 後可繼續推得: \begin{eqnarray} &&\hskip -25pty_1+\frac{n_1\delta}S\lt x_2-\frac{m_2\ell}{S}\nonumber\\ &\Leftrightarrow&x_2-y_1\gt \frac{n_1\delta+m_2\ell}{S}\ge \frac{\delta+\ell}S\label{8}\\ &\Leftrightarrow&S\gt \frac{\delta+\ell}{x_2-y_1}=\frac{x_1-y_1+x_2-y_2}{x_2-y_1}=1+\frac{x_1-y_2}{x_2-y_1} \label{9} \end{eqnarray} 其中 \eqref{8} 利用到 $n_1,m_2\ge 1$。 上述 \eqref{9} 式就是表 2 關於 $S$ 取值的必要條件, 不妨稱之為 $S$ 的取值條件式。 若我們取表 1 中 $x_1,x_2,y_1,y_2$ 之值做為例子, 將其代入 \eqref{9} 可得 \begin{equation} S\gt 1+\frac{21-12}{19-15}=3\frac14\label{10} \end{equation} 從 \eqref{10} 式看來, 難道說兩個班級都只要有 4 個人就可以設計出表 1 那樣的例子? (表 1 的兩班總人數都是 40 人)且讓我們沉住氣一下, 就先取 $S=4$ 沒關係。 注意在 \eqref{4}, \eqref{5} 之後的討論, 我們知道要使 $\dfrac{n_1}S,\dfrac{m_2}S$ 兩數儘量小, 因此我們再取 $n_1=m_2=1$, 此時表 2 變成底下的情形:
三、模仿除了研究表 1 的例子, 我們不妨自己練習造個例子, 如下表:
四、結語像表 1 與表 6 這樣滿足辛普森悖論的統計結果, 直觀上來說, 因兩表中甲班的女生人數佔大多數, 所以甲班總錄取率 $p_1$ 會靠近該班女生的錄取率 $y_1$; 而兩表中乙班的男生人數佔大多數, 所以乙班總錄取率 $p_2$ 會靠近該班男生的錄取率 $x_2$。 而表 1 和表 6 一開始就設計讓 $y_1\lt x_2$, 所以 (從圖1) 也不難看出會有 $p_1\lt p_2$ 的可能了。 經過上述的研究過程, 我們大約理解了這類統計例子的由來, 並且應該也能自己設計出其他的例子。 之後若您有朋友看到此類例子而感到疑惑, 愛好數學的你, 或許可以有信心地告訴他們: 「嘿! 朋友, 我知道那個例子是怎麼設計的, 讓我先來畫個圖 (圖1), 再慢慢解釋給你聽, 好嗎?」 關於辛普森悖論更進一步的介紹, 有興趣的讀者可參考參考資料---本文作者任職麥當勞竹南民權中心--- |