演讲者:丘成桐
时间:2018年7月6日
地点:天文学数学博物馆国际会议室
内容来自《数学传播》第42卷第4期
爱因斯坦广义相对论的根源是试图整合其发展的狭义相对论和牛顿引力理论。
他在1915年完成这项艰巨的任务。大多数物理学家认为这是人类历史上最具创造力的科学工作。容我在此阐释这个理论的一部分。爱因斯坦
一个重大要素是“等效原理(equivalence principle)”的概念, 其发展之历史至为悠久。伽利略曾以实验验证:物体因重力引起的加速度, 与质量无关。克卜勒曾说:“任意放置的相邻两块石头, 若不在其他同类物体的影响范围, 则它们会如两根磁针聚拢于中间点, 而一块石头朝对方趋近的量, 会与对方的质量成正比。”
爱因斯坦在1970 年说道:
“我们假设重力场与参考系统的相应加速度在物理上完全等效。 小测试物体的重力运动, 仅取决于它在时空的初始位置及速度, 而与它的构造无关。 在自由落体实验室里的任何实验(无论有无重力) 结果, 与实验室的速度及实验室在时空中的位置无关。”
因此, 爱因斯坦意识到, 在他想发展的新重力理论中, 重力定律应与观察者无关。但他需要一个框架来构建此种重力理论, 联系起哲学与观察。由于重力等价于参考系统的加速度, 且质点的加速度可藉由其轨迹的曲率来描述, 爱因斯坦推测:新的重力概念应该与新的空间概念有关。他知道(有固定的坐标系的) 静态空间是不适用的。
爱因斯坦的伟大工作受益于许多几何学家的帮助。他和Grossmann同受业于杰出的几何学家兼物理学家Minkowski。他也与Levi-Civita 长期交流, 后来与Hilbert 和Noether 也时有互动。但最重要的是, 19 世纪大数学家黎曼的空间概念, 对爱因斯坦划时代的贡献居功厥伟。
在黎曼之前, 只有三种类型的空间: 欧几里德空间、 球面空间及双曲空间; 它们都由单一坐标系统描述, 类似当年牛顿所设想的静态宇宙。
然而黎曼在1854 年发表著名的论文“关于几何基础的假说”, 彻底改变了空间的概念。他的空间与上述三种空间全然不同, 且在无固定参考坐标系的情况下仍可存在。他也知道: 当两点非常靠近时, 我们感觉不到加速度, 所以在一阶效应下, 我们感受不到曲率的存在。因此, 在无限小的尺寸, 空间应看似平坦的欧几里德空间。另一方面, 重力的二阶效应必来自质点的加速度。因此, 用于描述重力的动态时, 空间应展现曲率。
我们不确知大域空间是何样貌。另一方面, 空间应该具有足够的一般性, 能在不改变重力的物理本质之下, 容许不同的观察者, 并让他们得以互通信息。因此, 黎曼要求: 我们可使用各种不同的座标系来观察空间的基本属性, 但空间有意义的属性应与坐标系的选取无关。这种空间观点至关紧要, 因为它正是广义相对论中关键的等效原理。
黎曼
在引入抽象空间时, 黎曼定义了曲率的概念。事实上, 广义相对论中重力场的推展是由曲率来量度, 而物质分布是由曲率的一部分来表示; 随着时间推移, 曲率也会随着物质分布的变化而起伏。
曲率的动态显示了时空振动的效应。正因如此, 爱因斯坦得出结论: 重力波尽管微弱, 必当存在。在爱因斯坦方程, 重力场与时空几何不可分割, 浑然一体。
值得注意的是, 在1854 年的演讲中, 黎曼开发新的空间概念, 是为了要理解物理现象。他甚至建议用不同的方式描述空间中至小和极大的部分。从现代物理的角度来看, 黎曼正在寻找量子空间的可能结构!黎曼曾考虑使用离散空间来阐释这个问题。
黎曼自25 岁开始科学著述, 39 岁时因肺疾辞世。过世之前的三年, 他每年都前往意大利避寒, 从而影响了意大利和瑞士的诸多几何学家, 包括Christoffel、 Ricci及Levi-Civita。
他们推广了黎曼的想法, 严格定义了张量和连络(connections), 两者都是广义相对论和规范场理论所不可或缺。Ricci 引入了Ricci 曲率张量, 并证明此张量可产生一个满足守恒律的张量。这些由几何学家在19 世纪中后期完成的工作, 为广义相对论提供了至关紧要的工具。
爱因斯坦在1934 年撰写了题为“广义相对论起源札记(Notes on the origin of the general theory of relativity)” 的文章(见Mein Weltbild, 阿姆斯特丹: Querido 出版社) , 回顾了广义相对论的发展。第一阶段当然是狭义相对论。除了爱因斯坦本人, 该理论的主要创始人还包括Lorentz 和Poincaré。
一个最重要的结果是: 距离受时间影响。但爱因斯坦知道: 狭义相对论与牛顿重力理论的远距离作用(action at a distance)并不相容, 必须予以修正。
牛顿
起初, 物理学家没有意识到: 黎曼做了突破后, 空间概念已发生了根本性的变化。他们试图在三维空间的框架内修正牛顿的重力理论, 使之与甫发现的狭义相对论一致。这个想法导致爱因斯坦误入歧途三年。
爱因斯坦在“广义相对论起源札记” (第286-287 页) 中说:
我当然熟悉Mach的观点;根据该观点,似可想像惯性阻力的反作用不属此类加速度, 而是关乎他物之质量的加速度。这个想法有令我着迷之处,但它没有为新理论提供可行的基础。最简单的方法当然是保留重力的Laplacian纯量位能, 并藉由某个对时间微分的项,以明显的方式完整写下Poisson方程,从而满足特殊相对论。重力场中质点的运动定律也必须因狭义相对论而做修改。其取径并未明确标出,原因是物体的惯性质量可能取决于重力位能。事实上, 基于能量惯性原理,这是合乎预期的。然而, 这些研究结果令我强烈怀疑。惯性和重力质量的等效原理现可极为清楚地陈述如下:在均匀的重力场中,相对于均匀加速的座标系,所有运动都如同发生在无重力场处。这个原则(“等效原则”)若适用于任何事件,就显示出:要获致自然的重力场理论, 相对论的原则需扩展至相互之间非均匀运动的坐标系。1908年至1911年, 这类思考使我烦劳不已…
Minkowski
爱因斯坦在苏黎世求学时, 他的数学教授Minkowski 是与Hilbert 和Poincaré 齐名的大数学家。Minkowski 曾说: ”我的班上有位懒惰的学生, 最近完成了一项重要的工作, 而我已对此提出了几何解释“。
Minkowski 的物理师承Helmholtz、 JJ Thomson 及Heinrich Herz。他认为: 由于“数学与自然之间先定的和谐”, 几何学可作为物理洞察力的关键。他把物理实相归结为时空几何。
1908 年9 月21 日, Minkowski 在科隆自然科学家和医师大会第八十次会议上发表了题为“空间和时间"的演讲, 其中所发展的空间及时间的想法, 随后被应用在他于1908年发表的论文"运动物体之电磁现象的基本方程"; 这是他在电动力学定律的主要工作。(Minkowski 于1909 年辞世) 。这篇生前最后的论文, 对有重量的介质, 提出了第一个相对论上正确的Maxwell 方程表述, 及其以张量运算表达的数学形式。实际上, 爱因斯坦与普朗克(Planck) 就Minkowski 的这项工作写了几篇论文。
普朗克与爱因斯坦
Minkowski 写道:
我想要铺陈的空间和时间观点, 已从实验物理学的土壤中迸现出来, 含藏着它们的力量。 它们很激进。 尔后, 空间及时间本身注定要消没于阴影, 惟有结合两者才能保有独立的实相。
有趣的是, Minkowski 承认: 在很大程度上, 他的时空概念归功于Poincaré 在1906 年的工作; Poincaré 当时注意到: 借着将时间取为虚数, Lorentz 变换会成为旋转。然而, Poincaré 并不认为四维表示具有太多物理意义。直到1908 年, Poincaré 仍表示: "三维语言似乎更适合用来描述世界, 尽管这种描述可改采另一种严谨的风格。"
这与Minkowski 的观点截然不同。他直言:
在某种意义上, 空间和时间的世界是四维的非欧流形。 事实上, 我们所处理的不仅是一种新的空间和时间概念。 我声称的是: 它是一个非常具体的自然法则, 由于它的重要性(因为它涉及所有自然知识的原初概念, 即空间和时间), 它堪称所有自然法则之首。
在1908 年的文章中, Minkowski 构建了一个四维空间, 仿效黎曼引入一个度量张量, 提出狭义相对论的几何意义。作为狭义相对论中基本对称群的Lorenzian群, 就成了Minkowski时空的等距群(group of isometries)。破天荒地, 我们从Minkowski 得知自己生活在四维时空中。于是, 在1908 年, 爱因斯坦从Minkowski 获得广义相对论最重要的灵感: 他必须根据空间应是四维的这一事实, 来构建他的新重力理论。
一般认为, 在这一年里, 爱因斯坦最重要的作为就是他的思考实验(thought experiment)。思考实验让爱因斯坦知道等效原理的重要性, 也让他了解以新几何展现重力的需要。他知道他需要新的空间概念来达成目的。牛顿重力的静态空间不复适用。
Minkowski 的文章为何如此重要?从三维空间至四维空间, 不仅是概念上的突破, 而且也唯有在四维空间内, 重力才能有足够的空间来展现它的动态性质!牛顿的重力理论是静态的, 单一函数即足以描述重力现象。
Minkowski 时空提出了最重要的概念, 即我们需要一个张量来描述重力。张量是甫发明的概念; 组成张量的众多函数协同一致地转换, 从而遵循等效原理。
Minkowski 的张量完美地描述了狭义相对论, 但爱因斯坦希望进一步将牛顿力学与Minkowski 空间结合起来。因此, 在无限小的尺度, 他的新时空理论应等同于Minkowski 时空。也因此, 当两点非常靠近时, 若仅虑及一阶效应, 掌控它们的重力规则应即Minkowski 时空的规则。然而, 考量重力的二阶效应时, 这不复属实, 曲率变得重要。当时, 物理学家对张量概念一无所知(事实上, 也只有少数几何学家了解张量分析。)
爱因斯坦由等效原理得知, 新的重力位能应取决于一点及该点之切空间的切线向量(速度向量), 但他不知道有何可用的数学工具。于是他求助于同窗Marcell Grossmann, 终于发现重力场应该用度量张量来描述。此张量在时空中不断变化, 但在每一点都可用一阶Minkowski 度量来作逼近。
Grossmann 是一位几何学家, 在苏黎世时曾帮爱因斯坦写几何作业。他在图书馆发现了张量的想法。然而, 单独引入度量张量的想法并不足以描述重力场。我们需要知道如何在弯曲的空间对张量做微分, 并希望微分的结果也与坐标系的选取无关(等效原理的要求)。这正是Christoffel 和Levi-Civita 的连络理论。
爱因斯坦在上述的广义相对论回忆录中说,这是他的第一个问题, 发现到已被Levi-Civita 和Ricci 解决。爱因斯坦的第二个问题是, 如何在这个新框架中推广牛顿的重力定律。牛顿方程很简单, 即重力位能的二阶导数等于物质密度。
当时, 爱因斯坦和Grossmann 都不知道该如何微分度量张量, 好让微分所得仍是与座标选取无关的张量。在爱因斯坦一再央求下, Grossmann 勉为其难去了图书馆, 找到Ricci 的工作。结果Ricci 早已将黎曼的曲率张量收缩为对称的二阶张量; 它与度量张量有相同的自由度, 可视为度量张量的二阶导数。爱因斯坦立即意识到: 它必定是场方程的左侧, 而右侧是一般物质分布的张量(在平坦空间中, 该张量已被深入研究。) 在两篇分别发表于1912 年及1913 年的文章中, 爱因斯坦和Grossmann 提出了这个方程式。
然而, 当爱因斯坦试图藉由渐近方法解此方程时, 并未重现他试图解释的天文现象(例如光偏折、 水星在近日点的偏移) 。这让他非常沮丧。
随后的几年里, 他为了解释天文现象, 试图选取特殊坐标, 实质上放弃了珍贵而简洁的等效原理。他与Levi-Civita 之间的诸多交流也无所助益。
为佐证我的陈述, 兹援引爱因斯坦的论文: 广义相对论起源札记(1934年, 第288-289页)
我很快就发现:等效原理所要求计入的非线性变换, 与坐标的简单物理诠释势必无法共存;亦即, 坐标差异不再彰显理想尺度或时钟的直接测量结果。
我对此认知深感困扰, 因为我花了很长的时间, 才了解物理学中坐标的意涵。直到1912 年, 我才找到摆脱此困境的方法, 它是做以下考虑之后的心得: 必须找到一个新的惯性定律; 当没有"实存的重力场"时, 若以惯性系统为座标系, 该新定律即为伽利略的惯性原理。伽利略所陈述的是: 一个未受力的质点, 在四维空间中将表征为一直线, 亦即一段最短的线, 或者更确切地说, 一条极值线(extremal line)。
该概念预先假定线元的长度,亦即度量。在狭义相对论中,如Minkowski所示,该度量为拟欧几里德(quasi-Euclidean),亦即线元『长度』 的平方是座标微分的某个二次函数。如果藉由非线性变换引入其他座标,则 仍是座标微分的齐次函数,但函数的系数不再是常数,而是座标的某个函数。在数学术语中,这意味着物理(四维)空间具有黎曼度量。对于除了重力之外未受他力作用的质点,该度量的类时(timelike)极值线提供了质点的运动定律,而该度量的系数以选取的座标系来描述重力场。如是, 等效原理的自然表述已被找到, 它可扩展到任何重力场, 形成完全自然的假设。
因此, 上述困境的解决方案如下: 物理意义无关乎坐标的微分, 而仅与相对应的黎曼度量相关。现已找到了广义相对论的可行基础。然而, 还有两个待解决的问题:
1.若根据狭义相对论来陈述场律, 如何将其转移到黎曼度量的情况?
2.什么微分定律决定了黎曼度量(即 )?
就问题2而言,其解决方案显然需要藉由来构造二阶微分不变量。我们很快看出这些已由黎曼(曲率张量) 建立。在发表广义相对论的两年之前, 我们已经考虑了正确的重力场方程, 但无法看出它们如何用于物理。
爱因斯坦在1913 年至1915 年间持续拼搏。有趣的是, 在没有物质分布时, 爱因斯坦和Grossmann 写下的方程式其实是正确的。事实上, 在爱因斯坦和Hilbert 写下正确的场方程之后, Schwarzschild 在1916 年对球状恒星得到爱因斯坦方程的解。
Schwarzschild
Schwarzschild 的解假设物质不存在, 且该解足以计算由太阳的重力引起的光偏折。因此, 如果爱因斯坦和Grossmann 找到精确的球对称解, 他们大可在1913 年进行观察。显然, 当近似解未能提供与物理观察相符的正确答案时, 爱因斯坦气馁了。他非常沮丧, 并试图使用特殊座标, 放弃等效原理。以下的文字透显了他的沮丧:
相反地, 我确信它们未能妥当处理实验结果。更甚者, 我相信我可以在一般性的考虑下证明: 在座标变换下保持不变的重力定律, 与因果律不一致。 这些是思维上的错误, 致使我耗时两年过于艰苦地工作, 1915 年底才终于辨识出错误, 懊恼地回到黎曼曲率, 随即成功地将理论与天文观测的结果联系起来。
由最终的理解看来, 喜悦的成果似乎理所当然, 任何聪明的学生都能毫不费力地掌握它。但在黑暗中焦虑探索的岁月, 内中强烈的渴望、 交替更迭的信心与疲惫, 以及最终涌现的光亮- 只有经历过的人才能理解。
现在让我们回溯广义相对论的最后工作阶段发生的事。1915 年春, 爱因斯坦造访哥廷根的大数学家David Hilbert。Hilbert 当然深谙几何, 但最重要的是, 他是当代几何不变量理论的奠基者。他在哥廷根邀集了大批杰出的数学家, 其中的一些如下述: Felix Klein 是援用对称群来分类几何的先驱, Hilbert 的学生Hermann Weyl 是规范场理论的奠基者, Emmy Noether 堪称史上最伟大的女性数学家。在1915 年至1918 年期间, Noether 发展了她的流(current) 理论, 据此我们可使用连续对称来推导运动方程。(在广义相对论中, 连续的对称群是坐标变换的群。)
爱因斯坦的访问恰逢其时!Hilbert 在同年11月发现了Hilbert作用量(action), 借之迅即推导出正确的重力方程。获悉此事并收到Hilbert 关于方程式的明信片后, 爱因斯坦也快速获得他的方程式, 且据此推算出他一直试图解读的天文现象。
起初, 爱因斯坦不满Hilbert抢得头筹。但Hilbert旋即宣称这项工作应该完全归属于爱因斯坦, 让爱因斯坦宽了心。这是一项划时代的工作。后代物理学家和数学家都应向爱因斯坦致以最崇高的敬意。但我希望历史记住那群几何学家, 莫忘他们曾帮助爱因斯坦完成伟大的重力理论。凡此所述大都出自爱因斯坦的文章。遗憾的是, 在那篇文章中, 他并未提到Hilbert的贡献。
回头看, Hilbert 和爱因斯坦导出的正确运动方程, 其实Grossmann 及爱因斯坦在1913 年早能发现。1913 年之方程式左侧是Ricci 曲率, 右侧是物质张量。右侧是吾人所熟悉的, 符合守恒定律。但方程式左侧是不满足守恒律的Ricci 张量。所以两侧不会相等。因此, 左侧应该置换为满足守恒律的某种曲率张量。事实上Ricci 早已用Bianchi 恒等式发现了此种张量, 亦即把度量张量乘上Ricci 张量的trace, 而后将Ricci 张量减去此乘积。如果爱因斯坦和Grossmann 信赖几何的美, 并试图根据其内在一致性完成方程式, 就不必等到1915 年才写下正确的方程式。
完成广义相对论后, 爱因斯坦认为: 物理学最基本的部分应由思考实验及数学的优雅来主导。在文章的最后, 他说: 在找到广义相对论的方程之后, 一切都来得如此自然而简单, 对有能力的学者来说轻而易举。然而, 在找到真理之前, 他殚精竭虑, 经年劳瘁, 日夜承受煎熬, 箇中艰辛难以言说。爱因斯坦的工作堪称人类所曾完成的最伟大科学工作。
广义相对论的成功留给我们另一项艰巨的任务: 解释重力的自然现象。任务之所以困难, 是因方程组为十足地非线性, 且背景时空呈动态变化。对此复杂的非线性系统, 重力物理学无法准确描述其初始数据或边界条件。
动态变化的时空没有全域的对称性。全域时间不存在, 亦即类时的平移对称性不存在, 致使牛顿力学的许多重要物理量难以定义。如果类时平移能让系统保持不变, 则Noether 的流理论允许我们定义质量及线性动量之四维向量。但广义相对论的一般系统不存在连续的对称群。
不存在连续对称性, 致使我们难以定义经典概念, 诸如质量、 线性动量和角动量, 这些是理解重力物理学的基础。观看两颗中子星相互作用时, 我们需要知道每颗星球的质量及整个系统的束缚能(binding energy), 将物质和重力的贡献加总。这个问题出现在广义相对论, 因为该理论不容许能量密度的概念; 理由如下述: 如果存在密度, 它将仅取决于作为重力位能之度量张量的一阶讯息。然而, 我们总能找到一个座标系, 其度量张量的一阶微分在某点为零; 这意味着能量密度为零。
一百年前, 爱因斯坦已经意识到这些问题。基于模拟牛顿力学的拟张量(pseudo-tensor)概念, 他提出了能量的定义。Arnowitt, Deser 和Misner 在1962 年更精确地阐明此定义, 现今称之为ADM 质量。该定义适用于孤立的物理重力系统, 其总质量可被定义。从Noether 的观点来看, 这是很自然的, 因为对于孤立的物理系统, 我们期望在无穷远处存在渐近对称性, 且无穷远处的时间平移捕获系统的总能量。这是总能量的一个良好定义。但是, 它仅捕获总能量, 而我们需要探索部分能量的详细讯息。
再次, 这个至关紧要的问题可回溯至爱因斯坦。他曾提出重力辐射的概念: 时空的振动会辐射出提供能量的波。该能量来自系统的束缚能。Bondi、 van der Burg、 Metzner 及Trautman 澄清了此概念, 在一些迷矢超曲面( hypersurface) 上定义质量, 称之为Bondi 质量。它具有很好的特性, 会随零超曲面移往未来而减少。减少的Bondi 质量被诠释为重力辐射带走的能量。Bondi 质量的定义很重要, 因为它描述了时空的动态。然而, 该定义预设某些取决于爱因斯坦方程动态的时空结构。
ADM和Bondi质量本质上都是总质量,无法捕捉到与他物作用中的物体之质量。一个重要的问题是:如何定义两个相互作用的中子星之束缚能。因此,我们需要一个拟局部(quasilocal)质量的概念:在时空中给定一个封闭的二维(类空间)曲面 S,它包含的总能量是多少?如果 S 是时空中某三维的类空间流形 M的边界,我们想测量 M 中 S 所包围的总质量。既然我们想确保能量守恒,那么我们想要的量应该完全取决于时空中 S 的讯息,而与 M的选取无关。这是拟局部质量的守恒律。
长久以来, 这个量的存在性一直是个严肃的问题。爱因斯坦和广义相对论领域的后继学者最感兴趣的是: 孤立物理系统的ADM 质量总量是否为正?
事实上, 在1957 年, Bondi 和其他著名的物理学家曾聚会, 讨论广义相对论中负质量的可能性。爱因斯坦的理论无法判断这是否可能。但如果总质量为负, 则系统可能会崩塌, 这意味着: 对不稳定系统, 爱因斯坦的重力理论可能会产生相当让人困扰的效应。
Schoen 和我在1979 年证明了ADM 质量为正, 并于1981 年发表完整的证明。我们的证明较为几何性。随后, Witten 藉由Dirac 算子给出了另一个证明; 它对物理学家来说更易了解。不久之后, Bondi 质量也被证明为正。于是, 在重力作用下, 孤立物理系统总质量的情况非常令人满意。
Schoen和我用我们的方法有效地证明:黑洞会在物质密度足够大时形成。关于物质密度很大时黑洞的形成, 这可能是第一个严谨的陈述。
证明拟局部质量的良好定义存在, 耗时甚久, 涵盖的工作分属多人, 包括Penrose、 Hawking、 Brown-York、 Geroch、 Horowitz 和史宇光-- 谭联辉。对平坦的Minkowski 时空中的任何封闭曲面, 这应该是零, 而对一般时空它是非负。因此, 如此的定义可存在, 且与ADM和Bondi 的既有结果相容, 实属奇迹。有两个重要的定义被提出: 其一是由Robert Bartnik, 另一个是由王慕道和我。
拟局部质量允许我们定义与双联(binary)黑洞相关的束缚能, 它与重力辐射的能量有关。王慕道和我利用我们的方法, 与陈泊宁(Po-Ning Chen)定义了拟局部角动量, 有助于澄清之前的总角动量定义。
经由Richard Schoen 及他的共同作者的工作, 我们知道Bartnik 定义的质量不同于王慕道与我定义的。去了解何者对描述重力的物理动态较有裨益, 会是有趣的工作。
其他许多关于重力的重要经典概念, 在广义相对论中有其对应物, 然而广义相对论的非线性性质使其难以被定义。但我认为: 诸多几何分析学家近日取得的进展, 将非常重要。
拟局部质量和拟局部角动量的概念, 打开了一扇研究时空物理和时空几何的窗口。更多的努力需要投注于其研究。
对孤立物理系统中的物体, 这些定义最有成效。而在理解更一般的情况, 以涵盖更高维度的类似物时, 它们仍然有用。这些概念的研究涉及相当复杂的几何。
在上个世纪, 藉由物理洞察力, 爱因斯坦的重力理论开启了我们对几何的深刻理解, 反之亦然。我们预计这在本世纪将被延续。Stony Brook 的会议中, 有极为有趣的活动, 展现了几何、 分析和物理相互作用的未来, 令人兴奋。
* 回复“丘成桐”可获取本文PDF文档
传播数学,普及大众
长按识别二维码关注我们
欢迎把我们推荐给你身边的朋友
▼
▼▼▼点击阅读原文发现更多好玩的数学。