37104 狹義相對論劄記
狹義相對論劄記

自從愛因斯坦在 1905 年發表有關狹義相對論的論文 $\ll$論動體的電動力學, 德國物理學雜誌 Annalen der Physik, 17 卷 891-921 頁$\gg$ 1 1 註: 中譯本請見 $\ll$愛因斯坦文集 第二卷$\gg$, 新竹凡異出版社。 英譯請見 $\ll$The Principle of Relativity$\gg$ Dover Publications, Inc. 1952. 之後, 相關的討論無數, 以下只是個人的讀書筆記。

本文共分兩節, 第一節探討用以聯繫兩個互以等速運動的慣性系之間坐標變換的屬性, 並以基礎數學證明這些變換必須是線性的。 第二節用固有值及固有向量的想法來得到這些變換 (勞倫茲變換) 的基本形式, 並指出第一節的結論主因"相對性原理", 第二節的結論主因"光速不變原理", 此二原理是愛因斯坦 1905 年論文的思想基礎:

  • (1) 物理體系的狀態據以變化的定律, 同描述這些狀態變化時所參照的坐標系究竟是用兩個在互相以等速移動的坐標系中的哪一個並無關係。
  • (2) 任何光線在 "靜止的" 坐標系中都是以確定的速度 $c$ 運動著, 不管這道光線是由靜止的還是運動的物體發射出來的。
以上這兩段引文正是愛因斯坦據以發展狹義相對論的基礎, 分別稱為相對性原理和光速不變原理。

一. 線性變換的必然性

在第一節中, 我們嘗試回答下列問題: 在狹義相對論中, 用以聯繫兩個 (互以等速運動的) 慣性系之間的坐標變換, 為什麼必須是線性的?

所謂線性, 是指從一個慣性坐標系 $K(x,y,z,t)$ 轉換成另一個慣性坐標系 $k(x',y',z'$, $t')$ 時, 坐標之間的方程式必須是一次多項式的形式。回顧愛因斯坦 1905 年的論文, 他對線性的論述如下:

對於完全地確定靜系中的一個事件的位置和時間的每一組值 $x,y,z,t$, 對應有一組值 $x'$, $y'$, $z'$, $t'$, 它們確定了那一事件對於坐標系 $k$ 的關係, 現在要解決的問題是求出聯繫這些量的方程組。

首先, 這些方程顯然應當都是線性的, 因為我們認為空間和時間是具有均勻性的。 2 2 註: 引文中的靜系指 $K$, 只是方便的稱呼, 事實上 $K$ 和 $k$ 均無法察覺自己究竟是處於靜止還是等速運動, 因為他們都是慣性坐標系。此處的 $x',y',z',t'$ 原文是用 $\xi,\eta,\zeta,\tau$。

在宣稱時、空的均勻性 (homogeneity) 強制 $K(x,y,z,t)$ 和 $k(x',y',z',t')$ 之間的轉換必須服從線性之後, 愛因斯坦對沿著對方 $x'\hbox{、} x$ 軸, 互相進行等速運動的 $K\hbox{、} k$ 系統, 在 $y\hbox{、} z$ 軸和 $y'\hbox{、} z'$ 軸保持平行的狀況下, 從光速不變原理 3 3 註: 光速不變原理 (Principle of the constancy of the speed of light) 是指光在任意慣性系中都是以確定的速率 $c$ 運動, 不論光源對此慣性系是靜止還是作等速運動。 推得下列方程式 \begin{equation} \begin{cases} \ \ x' = (x-vt)\Big/\sqrt{1-\frac{v^2}{c^2}} \\ \ \ y' = y \\ \ \ z' = z \\ \ \ t' = {\displaystyle(t-\frac{v}{c^2}x)}\Big/\sqrt{1-\frac{v^2}{c^2}} \end{cases} \end{equation} 式中 $c$ 是光速, $v$ 是 $K$、 $k$ 系統的相對速度, 兩者均為常數。 $c$、 $v$ 之外, 所有變量均以一次出現。 上式顯然滿足線性的要求, 然而愛因斯坦並未對時空的均勻性和坐標轉換的線性條件其間的關係作進一步的解釋 4 4 註: 上面這組坐標轉換式稱為勞倫茲變換, 證明見本文的第二節。 。 必須指出, 狹義相對論除了光速不變原理之外, 還有一個設準 (Postulate), 即相對性原理 (Principle of Relativity), 此一原理主張在 $K(x,y,z,t)$ 和 $k(x',y',z'$, $t')$ 中所見的物理定律是一致的, 例如在 $K(x,y,z,t)$ 所見的等速直線運動, 在 $k(x',y',z',t')$ 看來也是等速直線運動, 又例如, 兩物體對 $K$ 系看來速度相等, 則對 $k$ 系看來也必須速度相等 5 5 註: 相對性原理保證牛頓運動第一定律 (在一慣性系中, 若無外力作用, 靜者恆靜, 動者保持等速運動) 在 $K$ 和 $k$ 系中均成立, 並且保證在 $K$ 系中若見兩物體速度相等, 則在 $k$ 系中所見兩物體的速度也相等。 注意此處所謂的速度是指速度向量, 並非僅指速率。 。 在仔細的考察了牛頓運動第一定律之後, 我們認為相對性原理正是慣性系 $K(x,y,z,t)$ 和 慣性系 $k(x',y',z',t')$ 之間的轉換必須服從線性的主要原因, 以下是我們對此一看法的證明。

首先, 若是對一個事件, $K$ 系紀錄為 $(x,y,z,t)$ 而 $k$ 系紀錄為 $(x',y',z',t')$, 則將 $(x,y,z$, $t)$ 到 $(x',y',z',t')$ 的轉換記為 $T$, 並將 $T$ 看成是從 $\mathbb R^4$ 到 $\mathbb R^4$ 的一一對應, 不妨假設 $T(0,0,0,0)=(0,0,0,0)$。

若是在 $K$ 系中有一等速直線運動 $(\vec{a}+ t\vec{e},t)$, 時間參數為 $t$, 三維速度向量為 $\vec{e}$, $t=0$ 時位置在 $\vec a$, 則經由 $T$ 的轉換, 根據相對性原理, 必然是 $k$ 系的等速直線運動 $(\vec{a'}+t\vec{e'},t')$。 此外若是在 $K$ 中有相同速度 $\vec{e}$ 的兩個等速直線運動, 則在 $k$ 中所見亦具有相同的速度 $\vec{e'}$。 換句話說, $T$ 將 $\mathbb R^4$ 中的直線對到 $\mathbb R^4$ 中的直線, 並且將互相平行的直線對到互相平行的直線 6 6 註: 雖然在狹義相對論中, 由於光速不變原理, 所有運動體的速率必須小於光速, 因此等速直線運動所涉及的 $\mathbb R^4$ 中的直線並非直線的全體, 但是已經足夠用來提供 $T$ 是線性的證明。 。 其次, 由於 $T$ 要保持時間的連續性和單調性, 因此 $T$ 在將直線對到直線時, 在直線上看來, $T$ 是連續的。

從上述 $T$ 的「直線屬性」, 我們分四個步驟來證明 $T$ 一定是線性變換。

步驟一. 設 $T$ 將直線 $L$ 對到直線 $L'$, $P$、 $Q$ 是 $L$ 上的兩點, 則 $T$ 將 $\overline{PQ}$ 的中點對到 $\overline{T(P)T(Q)}$ 的中點。

證明: 如圖一, 慎選 $M$ 和 $N$ 兩條直線分別過 $P$、 $Q$ 兩點, 並且與 $L$ 形成一個三角形, 假設 $T$ 將 $M$ 和 $N$ 分別對到直線 $M'$ 和 $N'$。

在三角形三邊上各取中點 $A\hbox{、} B\hbox{、} C$。由於 $T$ 的單調性, $P\hbox{、} A\hbox{、} Q$ ($Q\hbox{、} C\hbox{、} R$ 及 $R\hbox{、} B\hbox{、} P$) 的順序在 $T$ 對應之下不變, 因此得到一個三角形及其邊上的三點如圖二:

注意到 $\overline{AB}$、$\overline{BC}$、 $\overline{CA}$ 分別和 $N$、 $L$、 $M$ 平行, 這樣的性質當然也轉換成 $\overline{T(A)T(B)}$、 $\overline{T(B)T(C)}$、 $\overline{T(C)T(A)}$ 分別和 $N'$、 $L'$、 $M'$ 平行, 易證 $T(A)$ 必是 $\overline{T(P)T(Q)}$ 的中點。

步驟二. 設直線 $L$ 過原點 $\vec{O}=(0,0,0,0)$, $L$ 上的點看成(四維)向量, 並設 $T$ 將直線 $L$ 對到直線 $L'$, 則 $T:L\rightarrow L'$ 滿足線性條件。

證明: 設 $\vec{V}$ 是 $L$ 上的(四維)向量 $T(\vec{V})=\vec{V'}$, $0\lt \lambda\lt 1$, 則因 $\vec{O}$ 和 $\vec{V}$ 之間的所有二分點均依序對到 $\vec{O'}$ 和 $\vec{V'}$ 之間的二分點。 又因 $T$ 在 $L$ 上是連續的, 所以 $T(\lambda\vec{V}) = \lambda\vec{V'}$。 今考慮 $\frac1\lambda\vec{V}$, 則因 $\vec{V} = \lambda(\frac1\lambda\vec{V})$ 而 $T(\vec{V}) =\vec{V'} = \lambda(\frac1\lambda\vec{V'})$, 類似的論證得到 $T(\frac1\lambda\vec{V})$ 必定是 $\frac1\lambda\vec{V'}$。 另一方面, $-\vec{V}$ 和 $\vec{V}$ 的中點是 $\vec{O}$, 所以 $T(-\vec{V})$ 也一定是 $-\vec{V'}$, 同理, $T(-\lambda\vec{V}) = \lambda T(-\vec{V}) = -\lambda\vec{V'}$, 滿足線性條件。

步驟三. 設 $A$、 $B$ 為 $\mathbb R^4$ 中的兩點, $\overline{AB}$ 的中點為 $C$, 則 $T(C)$ 是 $\overline{T(A)T(B)}$ 的中點。

證明: 如圖, 慎選四直線 $E\hbox{、} F\hbox{、} G\hbox{、} H$, $E\parallel F$, $G\parallel H$, $E$、 $G$ 過 $A$, $F$、 $H$ 過 $B$, 假設 $T$ 將 $E$、 $F$、 $G$、 $H$ 分別均對到直線, 並且要求 $E$、 $F$、 $G$、 $H$ 構成一個平行四邊形。

在此平行四邊形各邊取中點, 連成一個(歪)田字型, 如圖四:

由於田字的中心即 $\overline{AB}$ 的中點 $C$, 又因為 $T$ 保持平行線和各邊上的中點, 所以 $T(C)$ 一定是 $\overline{T(A)T(B)}$ 的中點。

步驟四. 設二直線 $L$、 $M$ 均過原點, $T$ 將 $L$、 $M$ 對到直線, $\vec{V}$、 $\vec{W}$ 分別是其上(四維)向量, 則 $T(\vec{V}+\vec{W})=T(\vec{V})+T(\vec{W})$。

證明: $\vec{V}+\vec{W}$ 是 $2\vec{V}$ 和 $2\vec{W}$ (端點) 連線段的中點。 由步驟三, $T$ 保持中點, 所以 $$ T(\vec{V}+\vec{W})=\frac12\left(T(2\vec{V})+T(2\vec{W})\right) $$ 再由步驟二, $T$ 滿足直線上的線性關係, 因此上式的右邊等於 $$ \frac12\left(2T(\vec{V})+2T(\vec{W})\right) = T(\vec{V})+T(\vec{W}) $$

為了具體呈現 $T$ 的形式, 我們作進一步的解釋。 首先, 我們在 $\mathbb R^4$ 中選四條過原點並且線性獨立的直線, 例如 \begin{align*} & E: (t\vec{e},t) = t(\vec{e},1) \\ & F: (t\vec{f},t) = t(\vec{f},1) \\ & G: (t\vec{g},t) = t(\vec{g},1) \\ & H: (t\vec{h},t) = t(\vec{h},1) \end{align*} 式中 $t$ 代表時間, $\vec{e}$, $\vec{f}$, $\vec{g}$, $\vec{h}$ 是三維向量, 代表等速直線運動的速度, 相關的四個四維向量 $\vec{a}= (\vec{e},1)$, $\vec{b}=(\vec{f},1)$, $\vec{c}=(\vec{g},1)$, $\vec{d} = (\vec{h},1)$ 構成 $\mathbb R^4$ 一組基底。 將標準基底 $(1,0,0,0)$、 $(0,1,0,0)$、 $(0,0,1,0)$、 $(0,0,0,1)$ 以 $\vec{a}$、 $\vec{b}$、 $\vec{c}$、 $\vec{d}$ 的線性組合表示, 例如 $(1,0,0,0)$ $ = \alpha\vec{a}+\beta\vec{b}+\gamma\vec{c}+\delta\vec{d}$, $(0,1,0,0) = \ldots$, 等等。

再將 $(1,0,0,0)$、 $(0,1,0,0)$、 $(0,0,1,0)$、 $(0,0,0,1)$ 對 $\vec{a}$, $\vec{b}$, $\vec{c}$, $\vec{d}$ 的線性組合表示帶入下式: $$ (x,y,z,t) = x(1,0,0,0)+y(0,1,0,0)+z(0,0,1,0)+t(0,0,0,1) $$ 整理後得到 $$ (x,y,z,t) = \xi\vec{a} + \eta\vec{b} + \zeta\vec{c} + \tau\vec{d} $$ 其中 $\xi=\xi(x,y,z,t)$, $\eta=\eta(x,y,z,t)$, $\zeta=\zeta(x,y,z,t)$, $\tau=\tau(x,y,z,t)$ 均為 $x,y,z,t$ 的一次式。由步驟二及步驟四可得: $$ T(x,y,z,t) = \xi T(\vec{a}) + \eta T(\vec{b}) + \zeta T(\vec{c}) + \tau T(\vec{d}) $$ 再將等號右邊的 $T(\vec{a})$, $T(\vec{b})$, $T(\vec{c})$, $T(\vec{d})$ 依坐標順序寫成 $(\ast,\ast,\ast,\ast)$ 的形式而有 $$ T(x,y,z,t) = (p,q,r,s) $$ 式中 $p,q,r,s$ 均為 $\xi,\eta,\zeta,\tau$ 的一次式, 因此可以再改寫為 $x,y,z,t$ 的一次式, 而 $(p,q,r,s)$ 即坐標轉換後的 $(x',y',z',t')$。 至此, 已完整的回答本節一開始提出的問題: " 在相對性原理之下, 用以聯繫兩個互以等速運動的慣性系 $K(x,y,z,t)$ 和 $k(x',y',z',t')$ 之間的變換一定是線性的, 亦即 $x',y',z'$, $t'$ 均表為 $x,y,z,t$ 的一次多項式。 "

二. 從光速不變原理證明勞倫茲變換

基於相對性原理及慣性定律, 我們已經證明 $K(x,y,z,t)$ 和 $k(x',y',z',t')$ 之間的轉換是線性的。 假設 $K$ 和 $k$ 系在時間 $t=0=t'$ 時, $x$、 $y$、 $z$ 軸分別與 $x'$、 $y'$、 $z'$ 軸重合, $k$ 系並且以等速 $v$ 沿 $x$ 軸運動, 因此 $x$ 和 $x'$ 軸始終保持重合。

先看 $y\hbox{、} z$ 和 $y'$、 $z'$ 軸, 在時間 $t=0=t'$ 時, 它們重合, 因此在 $k$ 系向右沿 $x(x')$ 軸運動時, $y'$ 和 $y$ 軸, $z'$ 和 $z$ 軸始終保持平行。原因是 $y'z'$ 平面、 $yz$ 平面均與 $x(x')$ 軸垂直, $y'$ 和 $z'$ 如果所指的方向改變, 就會違背 $xyz$ 空間自身的對稱性。

再者, $x'z'$ 平面和 $xz$ 平面重合, 注意到兩者的方程式分別為 $y'=0$ 和 $y=0$, 因此在坐標變換時, $y'$ 應該等於 $dy$, $d\gt 0$。這表示在 $K$ 系所見 $y$ 方向的長度若是 $L$, 則在 $k$ 系所見的長度為 $dL$, 基於對稱的理由, $d$ 必須為 1。 我們因此首先得到 $K$ 和 $k$ 系變換的兩個方程式: $$ y'=y, \qquad z'=z$$ 由於 $k$ 系過原點的 $y'z'$ 平面滿足 $x'=0$ 和 $x=vt$, 所以 $x'$ 與 $x-vt$ 僅差一個常數倍 $x'=\alpha(x-vt)$, 這表示 $x'$ 與 $y$、 $z$ 無關。

至於 $t'$, 如果 $t'=\beta x+\gamma t+by+ez$, 注意到 $K$、 $k$ 兩系統在垂直於 $x(x')$ 的方向上 (即 $yz$、 $y'z'$ 平面) 有一個繞 $x(x')$ 的旋轉對稱, 但是 $by+ez=0$ 代表 $yz$ 平面上的直線而非代表圓或點, 因此 $by+ez$ 並非旋轉不變, 除非 $b=e=0$。

結論是 $x'$、 $t'$ 僅與 $x$、 $t$ 有關。 再從光速不變原理, $x-ct=0$ ($x+ct=0$) 和 $x'-ct'=0$ ($x'+ct'=0$) 等價, 因此有 7 7 註: 亦即將 $(x,t)$ 及 $(x',t')$ 分別作變數變換 $(x-ct,x+ct)$ 及 $(x'-ct',x'+ct')$ 來表達 $T$。 \begin{equation} \label{eq2} \begin{cases} \ x'-ct' = A\cdot (x-ct) \\ \ x'+ct' = B\cdot (x+ct) \end{cases} \end{equation} 讀者不難發現, 如此利用光行路線在 $K$、 $k$ 系統中的不變性, 正是以求固有值和固有向量的方式來求解矩陣。

將 $x'=0$, $x=vt$ 代入 (\ref{eq2}) 得到 $$ -ct' = A\cdot(v-c)t, \qquad ct' = B\cdot (v+c)t$$ 兩式相除 $\displaystyle A/B = \frac{c+v}{c-v}$。

我們還需要一個條件才能決定固有值 $A$、 $B$, 決定的方式仍然是充分利用光速不變原理來聯繫 $K$ 和 $k$ 系。 現在, 在 $k(0',0',0')$ 向 $y'(y)$ 方向放一束光, 經過 $t'$ 秒後到達 $P$ 點, $K$ 系中所見如圖:

在 $k$ 和 $K$ 系中, $P$ 點的坐標分別是 $(t',0,ct',0)$ 和 $(t,vt,ct',0)$, 由畢氏定理得到 $$ c^2t^2 - v^2t^2 = c^2t'^2 $$ 將相關的坐標代入 (\ref{eq2}) 式 $$ \ -ct' = A\cdot (vt-ct), \qquad \ ct' = B\cdot (vt+ct)$$ 兩式相乘得到 $$ c^2t'^2 = A\cdot B\cdot (c^2t^2 - v^2t^2) \\ $$ 而有 $AB=1$。 再從 $\displaystyle A/B= \frac{c+v}{c-v}$, 可以算出 $$ A = \sqrt{\frac{c+v}{c-v}},\ \ B = \sqrt{\frac{c-v}{c+v}} $$ 將 $A$、 $B$ 的值代回 (\ref{eq2}) : \begin{equation} \label{eq3} \begin{cases} \ \ x'-ct' = \sqrt{\frac{c+v}{c-v}}(x-ct) \\ \ \ x'+ct' = \sqrt{\frac{c-v}{c+v}}(x+ct) \end{cases} \end{equation} 並將 (\ref{eq3}) 中兩式分別相加減再除以 2 或 $2c$ 就得到 \begin{equation} \label{eq4} \begin{cases} \ \ x' = (x-vt)\Big/\sqrt{1-\frac{v^2}{c^2}} \\ \ \ t' = (t-\frac{v}{c^2}x)\Big/\sqrt{1-\frac{v^2}{c^2}} \end{cases} \end{equation} 搭配 $y'=y$、 $z'=z$, 此即 $K$ 與 $k$ 系之間的坐標變換。 若將 (\ref{eq4}) 中的 $x$、 $t$ 以 $x'$、 $t'$ 反解: \begin{equation} \label{eq5} \begin{cases} \ \ x = (x'+vt')\Big/\sqrt{1-\frac{v^2}{c^2}} \\ \ \ t = (t'+\frac{v}{c^2}x')\Big/\sqrt{1-\frac{v^2}{c^2}} \end{cases} \end{equation} 這相當於將 (\ref{eq4}) 中的 $v$ 換成 $-v$, $x$、 $t$ 與 $x'$、 $t'$ 互換, (\ref{eq5}) 稱為 (\ref{eq4}) 的逆變換。

期望本文能夠提供讀者在學習狹義相對論時一個簡潔清晰的參考。

---本文作者為台灣大學數學系退休教授---