(一) 速度及速度的量測
速度的單位, 例如公尺/秒, 是兩個基本單位一長度(公尺)和時間(秒)一的比值, 因此量測速度的方式就是考察運動體在某一時段行經的距離, 然後求其比值。 以月台上的 $O_R$ 為例, $O_R$ 在月台上設置兩個相距100公尺的站牌, 假設 $O_R$ 看到火車頭在七點通過站牌1, 而在七點十秒通過站牌2, 則 $O_R$ 量得火車的速度是10公尺/秒。
讀者也許認為, 如此量得的其實是火車在此十秒的平均速度, 這一點我們完全同意。 但是如果已經知道火車對月台是以等速前進, 那麼速度和平均速度便無差異。 稍後, 我們就會談到慣性系統與等速這個議題。 至於火車司機 $O_M$, 他先看到月台上的站牌1通過火車, 接著又看到站牌2通過, $O_M$ 要問 :
(1) 站牌1和站牌2通過的時間 ?
(2) 站牌1和站牌2之間的距離 ?
如果是在牛頓力學的架構裡, 故事大概是這樣的。前一天 $O_R$ 請 $O_M$ 來月台上討論, $O_R$ 把一支校準好的錶給了 $O_M$, 並且現場秀 $O_M$ 站牌1和站牌2的距離, $O_M$ 完全同意其間的距離是100公尺。 第二天早上, $O_M$ 駕著火車通過月台, 他看到月台向他而來, 手上的錶指著七點時, 站牌1通過 $O_M$, 七點十秒, 站牌2通過 $O_M$。 $O_M$ 同樣以100公尺除以10秒而得到月台的速度是10 公尺/秒。
讀者當然會提出質疑, 上面的解說預設了量測時間和長度對 $O_M$ 和 $O_R$ 而言, 有相同的結果。但是, 這是牛頓力學的基本前提, 至於在相對論的架構之下, 站牌1和站牌2通過 $O_M$ 的時間差是否仍是十秒? 又站牌1和站牌2的距離對 $O_M$ 而言是否仍是100公尺 ? 這些都需要釐清, 而這正是相對論的基本課題。
事實上, 上述的質疑更精準的提法應該是, 站牌1、 2通過 $O_M$ 的時間差是否是 $O_M$ 系統中的十秒$_M$, 而站牌1和站牌2對 $O_M$ 而言, 距離是否是 $O_M$ 系統中的100公尺$_M$ ? 畢竟 $O_M$ 有自己意義下的秒$_M$ 和公尺$_M$。
附帶在此補充另一個 $O_R$ 量測 $O_M$ 速度的方法, 那就是 $O_R$ 站在站牌1量火車頭和火車尾通過站牌1的時間差, 例如是5秒, 然後以火車的長度除以5得到速度。不過此處火車的長度並非前一天火車停靠在月台的長度, 而是火車在運動時 $O_R$ 所量得的長度。 我們提醒讀者, 在相對論中, 有所謂的勞倫茲收縮現象, 而使 $O_M$ 自己所量火車的長度和 $O_R$ 所量的不同 (見本文第四節)。
有趣的是, 此處所提的的方法, 一般反而是在 $O_R$ 已知火車的速度是10 公尺/秒的前提之下, 用來量測運動火車的長度。 照上面所得的時間差5秒來說, 運動中火車對 $O_R$ 的長度是50公尺。
(二) 慣性坐標系和等速運動
慣性坐標系的定義是使牛頓運動第一定律成立的坐標系。 在此坐標系中, 一個不受外力影響的物體, 靜者恒靜, 動者則進行等速直線運動。 月台或向著月台等速進行的火車都在地球上, 雖然地球並不是嚴格定義下的慣性坐標系, 但是若是只看地表的運動, 月台和火車都可以看成是慣性系統 (加上扣除空氣阻力和鐵軌的摩擦力等等)。在這樣的坐標系中, 無論是月台上的 $O_R$ 或是火車上的 $O_M$ 都無法察覺自己在運動, 但也無法宣稱自己處於絕對靜止的狀態。
我們可以用一個現象來形容。坐在火車上的 $O_M$ 手上拿著一滿杯的咖啡, 當火車相對 $O_R$ 以等速直線行進的時候, $O_M$ 手中的咖啡紋風不動, 一點都沒有潑灑出來。 $O_R$ 手中的咖啡亦然, 始終是滿滿的一杯, 這些都是慣性系統的特徵。 在牛頓力學的架構之下, 月台坐標系 $(x,y,z,t)$ 和火車坐標系 $(x',y',z',t')$ 之間的轉換可以用一個伽利略變換來表達 : \begin{eqnarray*} x'&=&x-vt\\ y'&=&y\\ z'&=&z\\ t'&=&t \end{eqnarray*} 此處為了完整, 把 $z$, $z'$ 坐標也包含進去, 亦即想像月台 $O_R$ 和火車 $O_M$ 均處於三維的慣性系統, 而非僅止於在地球的表面。
在這組變換式中, 月台和火車都是沿著 $x$ (或 $x'$) 軸的方向 ($x$ 和 $x'$ 軸重合), 在時間 $t=t'=0$ 時, 火車 $O_M$ 和月台 $O_R$ 重合, 並且 $O_M$ 向著 $x$ 的正向以 $v$ 運動。
我們提醒讀者, 此式其實是帶著單位的式子, 我們不妨用秒及公尺來"一以貫之", 這是因為在牛頓力學的架構下, 長度和時間的概念是絕對的。
這組變換式的意義是說一個位置 --- 時間對 $O_R$ 而言是 ($x,y,z,t$) 的物體, 或者說, 在 $t$ 時刻, 位置在 $(x,y,z)$ 的物體, 對 $O_M$ 的位置 --- 時間是 $(x-vt,y,z,t)$。 這表示在 $t$ 時刻, $O_M$ 離開原點, 對 $O_R$ 而言是在 $vt$ 的位置, 因此物體對 $O_M$ 的位置就變成了 $x-vt$。(如下圖)
上述伽利略變換的逆變換是
\begin{eqnarray*}
x&=&x'+vt\\
y&=&y'\\
z&=&z'\\
t&=&t'
\end{eqnarray*}
這表示 $O_R$ 亦以 $v$ 公尺/秒的速度離開 $O_M$, 但是方向相反。
即使不考慮逆變換, 在原來的變換中, 以 $x=0$ 代入(這是 $O_R$ 的位置), 亦得到 $x'=-vt=-vt'$, 亦即 $O_R$ 以 $v$ 公尺/秒反方向離開 $O_M$。
可以這麼說, 在牛頓力學或是伽利略變換的架構下, 如果 $O_M$ 對 $O_R$ 的速度是 $v$ 公尺/秒, $v$ 是常數, 則 $O_R$ 對 $O_M$ 的速度亦是 $v$ 公尺/秒, 只是方向相反, 這個結論與第(一)節所言相符。
至於對慣性系統月台 $O_R$ 而言, 為什麼一定要相對以等速運動的坐標系 $O_M$, 才同時也是一個慣性坐標系呢? 那是因為在這兩個系統中, 「等速直線運動的物體」這個描述必須在兩個系統中同時成立。 我們不妨只看 $x-t$ 和 $x'-t'$ 這個二維的坐標關係, 並且把它們各自想成是一個用 $x-t$ 或 $x'-t'$ 描述的平面。 則在平面之中, 一個等速運動, 例如 : $x=at$ 是以一條直線表示。所以在坐標變換時, 等於是把直線對到直線, 因此時空的坐標轉換必須是線性的。我們因此有下述的結論 :
在變換時, 如果只涉及 $x,t,x',t'$ 坐標, 則變換是線性的充要條件, 就是把等速直線運動轉換成等速直線運動。
質言之, 如果坐標的轉換是線性變換 \begin{eqnarray*} x'&=&ax+bt\\ t'&=&cx+dt \end{eqnarray*} 則對 $O_M$ 而言, $O_R$ ($x=0$) 的 $x'$ 坐標是 $x'=bt$, 時刻 $t'$ 是 $t'=dt$, 因此對 $O_M$ 而言, $O_R$ 的速度是 $x'/t'=b/d$。 處於等速運動。而對 $O_R$ 而言, $O_M$ ($x'=0$)的 $x,t$ 坐標滿足 $ax+bt=0$, 因此速度是 $x/t=-b/a$, 也處於等速運動。 但是, 這兩個互以等速運動的坐標不一定是使用相同的"等速度", 除非 $a=d$。 再次強調, 上述的伽利略形式, 不但保證 $O_M$ 和 $O_R$ 相互以等速運動, 並且這兩個"等速"都是 $v$ 公尺/秒。 我們將在下節中討論在相對論架構之下, 互以等速運動的慣性系統, 其間的坐標變換。
(三) 勞倫茲變換
1905年9月愛因斯坦在德國《物理學雜誌》 Annalen der Physik 發表《論動體的電動力學》。 在這篇文章裡, 愛因斯坦提出了相對以等速運動的兩個慣性坐標系的轉換公式 : \begin{eqnarray*} x'&=&x-vt/\sqrt{1-v^2/c^2}\\ y'&=&y\\ z'&=&z\\ t'&=&t-\frac{v}{c^2}x/\sqrt{1-v^2/c^2} \end{eqnarray*} 式中 $c$ 代表光在真空中的速度, 它是一個常數, 近似值是 $3\times 10^8$ 公尺/秒。 一如第二節的情形, 我們假設 $O_R$ ($x=0$) 和 $O_M$ ($x'=0$) 的 $x$ 軸和 $x'$ 軸重合, $O_M$ 以 $v$ 公尺/秒的速度朝向 $x$ 軸的正向運動。 注意到這個被稱為勞倫茲變換的方程式中, 首先 $t'\not=t$, 亦即時間的概念不再絕對, 同時又有 $\sqrt{1-v^2/c^2}$ 在分母出現, 因而長度的概念也不再絕對。
愛因斯坦在得到上述變換之前, 先提出下列兩個假設, 然後據以推導 :
- (1)物理體系的狀態據以變化的定律, 同描述這些狀態變化時所參照的坐標系究竟是用兩個在互相勻速移動著的坐標系中的哪一個並無關係。}
- (2)任何光線在"靜止的"坐標系中都是以確定的速度 運動著, 不管這道光線是由靜止的還是運動的物體發射出來的。 2 2 原文引自中譯《論動體的電動力學》, 見《紀念愛因斯坦文集》第二卷 P.87, P.90, 新竹凡異出版社。 在愛因斯坦的論文裡, 是以 $V$ 代表光在真空中的速度, 此處為了方便, 將光速以 $c$ 表達。另外, 愛因斯坦指的坐標系是慣性坐標系, 光源亦是相對坐標系以等速運動者。
愛因斯坦並且主張 :
首先, 這些方程式顯然應當都是線性的, 因為我們認為空間和時間是具有均勻性的。
關於線性這個特質, 我們在第二節的論述說明了線性變換的意義代表此二慣性系統互以等速運動, 但是並不表示 $O_R$ ($x=0$) 觀察 $O_M$ ($x'=0$) 的速度等於 $O_M$ ($x'=0$) 觀察 $O_R$ ($x=0$) 的速度。 換句話說, 線性變換是體現愛因斯坦上述的假設(1), 因為在兩個慣性系統中, 所謂「等速直線運動」的概念, 是同時成立的(見本文第二節)。
至於假設 (2), 有關光速是常數的這件事, 其實是指, 例如在 $O_R$ 系統中, 所觀察到 $O_M$ 所發出的光, 其光速永遠都是常數 $c$ 公尺/秒, 不會因為 $O_M$ 對 $O_R$ 的等速運動而有影響。
另外, 我們應該解釋 $O_R$ 與 $O_M$ 的單位。 從愛因斯坦的論文中, 我們可以看出, 基本上是從 $O_R$ 的系統中準備了校準好的鐘和尺, 然後送給 $O_M$, 讓 $O_M$ 去量自己所在的火車長度。 但是這把原本在 $O_R$ 中定為 1 公尺的量桿 $P$ 送給 $O_M$ 之後, 當 $O_M$ 以 $v$ 的速度通過 $O_R$ 的時候, $O_R$ 量得運動的量桿 $P$ 就不再是 1 公尺, 而是 $\sqrt{1-v^2/c^2}$ 公尺, 這個現象稱為勞倫茲收縮。
(四) 勞倫茲變換的證明
既然了解到愛因斯坦的假設(1)等價於兩個互以等速運動的慣性系統之間的坐標變換必須是線性的, 並且已知 $O_M$ ($x'=0$) 沿 $x$ (及 $x'$) 軸向 $x$ 軸的正向以 $v$ 公尺/秒運動, 我們可以把此一坐標變換寫成 ($y'=y$, $z'=z$) : \begin{eqnarray} x'&=&a(x-vt)\label{1}\\ t'&=&b(t-\sigma x)\label{2} \end{eqnarray} \eqref{1} 式的解讀是 $O_M$ ($x'=0$) 在 $O_R$ ($x=0$) 的坐標是 $x=vt$ 或 $(t,vt)$。 兩式中的 $a=a(v)$, $b=b(v)$ 是兩個特定的常數(只與 $v$ 相關)。
接下來, 我們要充分利用假設 2 --- 光速是常數。 我們假想 $O_M$ 經過 $O_R$ 的時候兩個觀察者均同時向 $x(x')$ 軸的正, 反兩個方向發射光束, 向正方向的是 $x=ct$, $x'=ct'$, 反方向的是 $x=-ct$, $x'=-ct'$。 先令 $x=ct$, 得到 \begin{eqnarray*} x'&=&a(ct-vt)=a(c-v)t\\ t'&=&b(t-\sigma ct)=b(1-\sigma c)t \end{eqnarray*} 令此二式的左邊 $x'=ct'$ 而有 $$a(c-v)t=cb(1-\sigma c)t$$ 但是 $c\not=v$, 因為如果 $c=v$, 則 $\sigma=1/c$ 而使 \eqref{1}, \eqref{2} 變換的行列式為 0, 這是不允許的。因此 \begin{equation} a(c-v)=cb(1-\sigma c)\label{3} \end{equation} 再以 $x=-ct$ 代入 \eqref{1}, \eqref{2} 得到 \begin{eqnarray*} x'&=&a(-ct-vt)=-a(c+v)t\\ t'&=&b(t+\sigma ct)=b(1+\sigma c)t \end{eqnarray*} 同樣令此二式的左邊 $x'=-ct'$ 而有 $$a(c+v)t=cb(1+\sigma c)t$$ 因此 \begin{equation} a(c+v)=cb(1+\sigma c)\label{4} \end{equation} \eqref{3}+\eqref{4} 得到 $$2ac=2cb$$ 所以 $$a=b$$ 將 $b=a$ 代回 \eqref{4} 解 $\sigma$, \begin{eqnarray*} a(c+v)&=&ca(1+\sigma c)\\ av&=&c^2a\sigma \end{eqnarray*} 得到 $$\sigma=\frac v{c^2}$$ 我們暫時解出 \eqref{1}、\eqref{2}, $a$ 仍然未知 \begin{eqnarray} x'&=&a(x-vt)\\ t'&=&b(t-\frac v{c^2} x) \end{eqnarray} 注意到此時若取 $x=0$, 則 \begin{eqnarray*} x'&=&-avt\\ t'&=&at \end{eqnarray*} 所以 $O_R$ ($x=0$) 對 $O_M$ 的速度是 $x'/t'=-avt/at=-v$。
這回答了本文一開始的問題。不過, 這個結論來自於光速是常數。另外, 我們還要決定 $a=a(v)$。 由於我們已經證明 $O_R$ 對 $O_M$ 的速度是 $-v$, 因此我們有逆變換 \begin{eqnarray} x&=&a(-v)(x'+vt')\label{5}\\ t&=&a(-v)(t'+\frac{v}{c^2}x')\label{6} \end{eqnarray} 將 \eqref{1}, \eqref{2} 代入 \eqref{5}, \eqref{6} 得到 $$x=a(-v)\Big[a(v)(x-vt)+va(v)(t-\frac v{c^2}x)\Big]=a(-v)a(v)(x-\frac{v^2}{c^2}x)$$ 或者 \begin{equation} a(-v)a(v)(1-\frac{v^2}{c^2})=1\label{7} \end{equation} 為了理解 $a(v)$, 我們由 \eqref{1}, \eqref{2} 兩式考察 $a(v)$ 的物理意義。 假想, $O_R$ ($x=0$) 在 $t=0$ 看到火車頭 $O_M$ ($x'=0$) 通過, 並且在 $(x,t)=(0,t)$ 看到車尾通過, 由於火車 $O_M$ 的速度是 $v$, 所以運動火車對 $O_R$ 的長度是 $vt$。 但是對 $O_M$ 而言, 在 $(x,t)=(0,0)$ 時, $(x',t')=(0,0)$, 而在 $(x,t)=(0,t)$ 時 \begin{eqnarray*} x'&=&a(v)(-vt)\\ t'&=&a(v)t \end{eqnarray*} 因此靜止火車的長度是 $vt'=a(v)(vt)$。 亦即靜止所量火車的長度與運動所量火車的長度之比是 $a(v)$, 這個比值顯然與 $v$ 的方向無關, 所以 $a(v)=a(-v)$。 因此由 \eqref{7}, 得知 $$a(v)^2=1/(1-\frac{v^2}{c^2})$$ 亦即 $$a(v)=1/\sqrt{(1-\frac{v^2}{c^2})}$$ 將 $a(v)$ 代入 \eqref{1}, \eqref{2}, 勞倫茲變換的形式是 : \begin{eqnarray*} x'&=&x-vt/\sqrt{1-v^2/c^2}\\ y'&=&y\\ z'&=&z\\ t'&=&t-\frac v{c^2}x/\sqrt{1-v^2/c^2} \end{eqnarray*} 上述運動火車的長度是靜止火車長度的 $\sqrt{1-v^2/c^2}$ 倍, 稱為勞倫茲收縮。
(五) 從量測看相對速度是否相等的問題
回到本文一開始的問題。 $O_M$ 與 $O_R$ 是兩個互以等速運動的慣性系統, 如果 $O_M$ 對 $O_R$ ($x=0$) 的速度是常數 $v$ 公尺/秒, 則 $O_R$ 對 $O_M$ ($x'=0$) 的速度是否也是 $v$ 公尺/秒?
在先前(第二節)的討論中, 談到對互以等速運動的兩個慣性系統, 其間的坐標轉換必須是一個線性變換 : \begin{eqnarray*} x'&=&ax+bt\\ t'&=&cx+dt \end{eqnarray*} 此時對 $O_M$ ($x'=0$) 而言, $O_R$ ($x=0$) 的速度是 $b/d$, 對 $O_R$ 而言, $O_M$ 的速度是 $-b/a$, 因此 $a=d$ 是相對速度相等的充要條件。而在上一節對勞倫茲變換的討論, 我們看到從光速是常數出發得到 $a=1/\sqrt{1-v^2/c^2}=d$, 因此兩者的相對速度都是 $v$。 但是到此為止, 我們還沒有提出一個可以得到上述結論的量測方法。亦即是否有一個由 $O_R$ ($x=0$) 量 $O_M$ ($x'=0$) 速度的方法和同時亦由 $O_M$ ($x'=0$) 量 $O_R$ 的速度, 從而知道這兩個速度是相等的。
既然一切都歸於光速是常數這件事, 我們應該妥加利用, 正如愛因斯坦在論文中對同時性的討論。 3 3 同註1《文集》p.84。
現在假設 $O_M$ (火車)朝著 $x (x' )$ 軸的正向, 以速度 $v$ 通過月台 $O_R$, 如下圖, 在月台上任取一段距離 $L$, 分別在月台上的 $L$ 和 $-L$ 處放置一面鏡子。
當 $O_R$ 與 $O_M$ 重合的時候 ($x=x'=t=t'=0$), 從 $O_R$ 及 $O_M$ 同時向正、反兩個方向各射出一束光。 在 $O_R$ 系統觀察到正向的光射到鏡子再反射回來到達 $O_M$ 所需的時間是 $$T_1=2L(c+v)$$ 從 $O_R$ 發出反向的光射到鏡子再反射回到 $O_M$ 所需的時間是 $$T_2=2L/(c-v)$$ $O_R$ 計算 $T_2/T_1$ 得到 $(c+v)/(c-v)$, 然後據以解出 $O_M$ 對 $O_R$ 的速度 $v$。 現在假設 $O_R$ 對 $O_M$ 的速度是 $-u$。 由 $O_M$ 發出正向的光(等同於 $O_R$ 放出的光)射向置於月台上的鏡子, 此時 $O_M$ 看到月台及鏡子以 $u$ 的速度迎面而來, 光到達鏡子所需的時間是 $$L'/(c+u)$$ 其中 $L'$ 是 $O_M$ 所測 $t'=0$ 時鏡子的距離。因此光反射之後回到 $O_M$ 所需的時間是 $$T'_1=2L'/(c+u)$$ 再看由 $O_M$ 發出反向的光。 $O_M$ 看到置於月台上 $O_R$ 系統 $x=-L$ 的鏡子以 $u$ 的速度離 $O_M$ 而去, 這一道反向的光"追上"鏡子所需的時間是 $$L'/(c-u)$$ 因此, 光反射後再回到 $O_M$ 所需的時間是 $$T'_2=2L'/(c-u)$$ $O_M$ 計算 $T'_2/T'_1$, 得到 $(c+u)/(c-u)$, 然後據以解出 $O_R$ 對 $O_M$ 的速度 $u$ (或 $-u$)。 那麼, 如何理解 $u$ 和 $v$ 相等呢 ? 請看下頁圖 :
在 $t-x$ 平面圖中, $l_1$ 是斜率為 $c$ 及 $-c$ 的折線, 代表由 $O_R$ (及 $O_M$) 正向發出及反射後的光所走的路徑。 $l_2$ 是斜率為 $-c$ 及 $c$ 的折線, 代表由 $O_R$ (及 $O_M$) 反向發出及反射後的光所走的路徑。 $l_1$ 和 $l_2$ 與 $x=vt$ 相交於 $P'$, $Q'$ 兩點, 代表正、反向光反射之後回到 $O_M$ 的時空位置, $P'$, $Q'$ 在 $t$ 軸上的投影是 $P$, $Q$。 $OP$ 即 $2L/(c+v)$, $OQ$ 即 $2L/(c-v)$, 分別是 $O_R$ 所見正、反向光反射之後回到 $O_M$ 的時間。
$OQ/OP=(c+v)/(c-v)$, 並且等於 $OQ'/OP'$。
$OP'(OQ')$ 標記的是在 $(t,x)$ 坐標系中, 在 $x=vt$ 這條 $O_M$ 的路徑上, 光反射後回到 $O_M$ 的位置。
在線性坐標變換時, $OP'\to (t'_1=T'_1,x'_1=0)$, $OQ'\to(t'_2=T'_2,x'_2=0)$ 注意到 $T'_2/T'_1=OQ'/OP'$, 這是因為 $O$, $P'$, $Q'$ 在同一條直線上, 而且 $(T'_1,0)$, $(T'_2,0)$ 也在 $t'-x'$ 平面過原點的直線上, 線性變換保證 $T'_2/T'_1=OQ'/OP'$。 結論是 $(c+v)/(c-v)=T'_2/T'_1=(c+u)/(c-u)$, 從而 $u=v$, 在光速是常數的假設下, 回答了本文一開始提出的問題。 4 4 此處已假設 $v\lt c$, $u\lt c$。 反之, 如果 $v=c$, 亦即 $O_M$ 相對 $O_R$ 以光速運動, 則 $O_M$ 經過 $O_R$ 時, 見到 $O_R$ 放出的光, 變成 $O_M$ 和 $O_R$ 放出的光同步前進, 違背了愛因斯坦光速是常數的假設(見本文第三節)。至於 $v\gt c$, 那就更怪了, $O_M$ 見到 $O_R$ 放出的光變成反方向進行, 當然也違背光速是常數的假設, 因為速度是一個有方向性的概念。 請見下圖($t'-x'$ 圖)。
圖中 $l'_1$, $l'_2$ 代表 $O_M$ 向正、反方向放出的光所走的路徑, $t'$ 軸是 $O_M$ 的路徑, $T'_1$, $T'_2$ 對應上圖 $x=vt$ 線上的 $P'$ 和 $Q'$ 點, 因此有 $T'_2/T'_1=OQ'/OP'$。
附記 : 最早處理相對速度是否相等的是愛因斯坦, 他在On the electrodynamics of moving bodies一文談到這個問題, 請見The principle of relativity一書的第46, 47頁; 此書收錄了11篇有關相對論的文章, 第三篇就是上述愛因斯坦原發表於1905年的論文。 本文作者是在閱讀愛氏論文時, 意外的發現這個有趣的議題, 因此想從量測的角度來考量, 最後發現原來這個問題的解答仍然要回到光速是常數的前提。
---本文作者為台大數學系退休教授---