Upgrade to Pro — share decks privately, control downloads, hide ads and more …

GR_Schutz_light_180203__1_.pdf

rfvtgbtgb
September 30, 2018
37

 GR_Schutz_light_180203__1_.pdf

11234

rfvtgbtgb

September 30, 2018
Tweet

Transcript

  1. D raft T ranslation 初恋!广义相对论(原著第二版) 本书是被广泛采用的广义相对论入门教材,面向数学基础薄弱的本科生,在第二版中综合了清 晰、可读与严格性。 从黑洞到引力透镜,从脉冲星到宇宙学,Schutz 老师的教材以其标志性的简洁性与权威性讲 述了天体物理研究者与学生所关心的相对论内容。第二版包含了天文学家应用广义相对论得到的

    新研究成果;修订了关于相对论恒星模型的部分, 加入了关于脉冲星的新内容;完全重写了宇宙学 章节;以及添加了关于现代引力波探测器与预期的引力波源的广泛、全面的介绍。 新版本有超过 300 道习题,其中许多是新增的,这些习题有助于学生掌握广义相对论及其数 学工具。本书不拘小节的写作风格使得讲解内容更加易懂。为任课教师提供的由密码保护的习题解 答在www.cambridge.org/Schutz。1 Bernard Schutz 是 Max Planck 引力物理研究所主任, 英国 Cardiff 大学教授, 德国 Potsdam 大学和 Hannover 大学名誉教授。他也是 GEO600 探测器项目的主要研究者 (Principal Investiga- tor),LIGO Scientific Collaboration 的执行委员会成员。Schutz 教授曾获意大利引力学会的 the Amaldi Gold Medal。 1现在已经出了习题答案书A Student’s Manual for A First Course in General Relativity。 ——译者注 3
  2. D raft T ranslation 第二版前言 从本书第一版出版到现在修订版出版的 23 年里,广义相对论这一领域日趋成熟并蓬勃发展。 在广义相对论坚实的数学基础之上, 逐渐产生了大量实际应用,

    其中某些应用在第一版出版的 1985 年甚至是无法想象的。对广义相对论的研究也因此从专业理论物理教学的次要环节转变为核心环 节,越来越多的学生希望在本科阶段至少能学到一些广义相对论的基本内容。 本书的读者们很有耐心,他们一直使用本书的第一版来学习广义相对论的数学基础,但是第一 版中关于应用的内容已经严重过时了,例如黑洞天体物理学、探测引力波、探索宇宙等等。我希望 对第二版所进行的全面修订,可以使本书不再过时,向读者们统一而连贯地介绍经典引力论的现代 研究成果。 前八章几乎没有变化:纳入了供进一步阅读的参考文献,扩展了少数几节的内容。但整体上 看,广相理论数学基础的几何方法经受住了时间的检验。与前八章不同,对于处理天体物理大舞台 中广义相对论应用的后四章,则进行了大量更新与扩展,某些内容甚至完全重写了。 处理引力波的第 9 章,现在拓展了关于使用干涉测量装置(比如 LIGO 以及已计划建设的空 间探测装置 LISA)探测引力波的讨论,也加入了关于引力波可能来源的讨论,以及我们希望通过 探测引力波来获得什么。这是一个快速变化中的领域,引力波的首次直接探测随时都会实现2。第 9 章旨在提供一个用来理解这些探测活动内在原理的稳定框架。 第 10 章讨论了球对称结构的恒星为何能保持稳定,但也穿插了关于实际中子星的内容。中子 星可以看作脉冲星,是可供探测的引力波的潜在来源。 处理黑洞的第 11 章,加入了关于证明黑洞存在的天体物理学证据的大量内容。这些证据证明, 既存在恒星黑洞,也存在超大质量黑洞。令人惊讶的是,天文学家已经在大多数星系的中心发现了 这两种大型黑洞的存在。对 Hawking 辐射的讨论也略有修正。 最后,处理宇宙学的第 12 章完全重写了。第一版中我从根本上忽视了宇宙常数,按照当时的 看法假设宇宙的膨胀速度正在减慢,但当时还没有足够精确地测量出宇宙的膨胀速度。而现在我们 深信,根据大量相互一致的观测结果,宇宙正在加速膨胀。这可能是今天理论物理学所面临的最大 挑战,极大影响了粒子物理的基本理论,也极大影响了宇宙学问题。围绕以上观点,我组织了第 12 章的内容,阐述了一个纳入了宇宙学常数的,针对膨胀中宇宙的数学模型,然后详细讨论了天文学 中如何度测量宇宙的膨胀速度,最后探究了大爆炸之后宇宙逐渐形成了的物质组成。宇宙膨胀,暗 物质,暗能量,这些都在影响着今天的宇宙结构,甚至影响着我们的存在。通过这一章读者也许只 能简短地初识天文学家从这些问题中获知了什么,但我希望这已足够鼓励读者去继续学习更多内 容。 我在若干合适的章节纳入了更多习题,但从书中删去了习题解答。习题解答可以从本书的网站 上获取。 2LIGO 已于 2015 年首次探测到引力波。 ——译者注 5
  3. D raft T ranslation 6 本书的主题依然是经典的广义相对论,除了简要地讨论了 Hawking 辐射之外,不涉及量子引 力。虽然量子引力是今天理论物理研究中最为活跃的领域之一,但现在仍然无法给想要学习引力量 子化的学生指出一个清晰的方向。或许到第三版时就可能纳入处理引力量子化的一章了。

    我要感谢帮助我完成了第二版写作的许多人。一些人向我大度地提供了第一版中印刷错误与 内容错误的清单,这里尤其要提到 Frode Appel、Robert D’Alessandro、J. A. D. Ewart、Steve Fulling、Toshi Futamase(二間瀬敏史) 、Ted Jacobson、Gerald Quinlan、B. Sathyaprakash,当然 书中剩余的其他错误我文责自负。我也要感谢剑桥大学出版社的编辑 Rufus Neal、Simon Capelin、 Lindsay Barnes,他们非常耐心并给予我鼓励。当然我还要深深地感谢我的妻子 Sian,在我修订本 书期间的每时每刻,她都展现了极大的耐心。
  4. D raft T ranslation 第一版前言 我曾于 1975 年至 1980 年讲授过一门一学年的广义相对论本科课程,

    并逐渐形成了这本书。 这 次授课经历使我确信,本科生学习广义相对论时并不比学习其他本科水平的标准课程时(如电动 力学与量子力学)存在显著困难。过去 20 年间,主要在天文学的驱动下,物理学界对广义相对论 的研究兴趣迅速增加,这不仅使得我们更深入更完整地理解了广义相对论,也教会了我们以更简 单更物理的方式理解广义相对论。相对论现已进入物理学与天文学的主流,缺少相对论学科训练 的理论物理教学可以说是不完整的。在相对论出现的早期,其以令人敬畏的巨大难度而闻名(记 者: “Eddington 教授,世界上只有三个人理解 Einstein 理论,这是真的吗? ”Eddington: “第三个人 是谁? ”)3,这也许是今天难以在理论物理教学中推广广义相对论的首要障碍。这本教材旨在以适 合本科生水平展示广义相对论,使得学生可以理解广义相对论的基本物理概念与广义相对论实验 的内在原理,能求解一些初等问题,并为学习更为高级的广义相对论教材做好准备。 为了实现这一目标,我努力去满足两个相互矛盾的原则:第一,假定读者只了解最低要求的预 备知识;第二,避免稀释主题内容。不同于大多数入门教材,本书不假定学生学习过电磁学的显式 相对论表述、电磁波理论和流体力学。必要的流体力学内容会在相关章节进行阐述。不假定读者熟 悉电磁波的主要影响是不得不缓慢地引入引力波,从头研究波动方程。下文会完整列出阅读本书所 需的预备知识。 第二条原则,避免稀释主题内容,是非常主观而且很难描述的。我设法在最大程度上引入微分 几何,并不满足于只依赖与曲面的类比,但我没有纳入基础教材中非必需的广义相对论主题,例如 非度规流形理论、李导数和纤维丛。4我在最大程度上引入了非线性场方程,而不仅仅是那些线性 化理论,但只在平面与球对称两种情形下进行求解,此外还引用并考察了 Kerr 解。引力波主要在 线性近似下进行研究,但是会稍微使用一点非线性来推导引力波的能量与引力波发射体中的反应 效应。我设法为每个论题都打下足够多的基础,让学生能够在进行更为高等的研究时不必再从头学 起。 本书的第一部分(截止到第 8 章)按照大多数教材的典型顺序引入了广义相对论:复习了狭 义相对论,阐述了狭义相对论下的张量分析与连续介质物理,研究了 Euclid 空间与 Minkowski 空 间中曲线坐标系下的张量分析,以及弯曲流形上的几何学,弯曲时空中的物理学,最后是场方程。 其余四章我选择研究在现代天体物理中较为重要的几个论题。处理引力辐射的一章相比入门水平 上的常规内容更为详细,这是因为对引力波的成功观测也许将成为未来十年天文学中意义最为重 大的进展之一。处理球对称恒星的一章除了常规内容之外,还包含了一组有用的可压缩精确解(应 归功于 Buchdahl) 。关于黑洞的一章比较长,这一章相当详细地研究了视界处的物理性质,延伸讨 3Sir Arthur Stanley Eddington(亚瑟·斯坦利·爱丁顿爵士) ,英国天体物理学家、数学家,是第一个用英语宣讲相对论 的科学家。 ——译者注 4因此这里的处理思想不同于我的另一本书 Geometrical Methods of Mathematical Physics (Cambridge University Press, 1980b),其可以作为本书的补充。 7
  5. D raft T ranslation 8 论了 Kruskal 坐标系,然后探究了旋转黑洞(Kerr 黑洞) ,以简单地讨论了

    Hawking 效应(黑洞 辐射的量子力学原理)来结束本章。最后一章处理宇宙学,推导出了均匀各向同性度规,并简单研 究了宇宙观测与宇宙演化的物理学原理。一个附录总结了本教材所需要用到的线性代数知识,另一 个附录包含了部分习题的提示与解答。其它教材长期以来涉及,而我决定本书不需特别突出的一个 主题,是广义相对论及其它引力理论的实验验证。与实验验证有联系的重点内容会在用到时再做处 理,但当前已经需要一整本书 (Will 1981)5才能系统讨论实验验证。对于广义相对论的正确性,今 天的物理学界相比十几二十年前要更有信心,因此我认为在一本现代的基础教材中讨论其它引力 理论是不大合适的,就像基础电磁学教材中不会讨论其他电磁理论那样。 本书假设学生已经学过:狭义相对论(包括 Lorentz 变换和相对论力学) ,Euclid 空间的向量 分析,常微分方程和简单的偏微分方程,热力学和流体静力学,牛顿引力理论(简单学过恒星星结 构是有用的但非必须) ,足够的初等量子力学(知道光子是什么) 。 本书的符号与约定与 Misner 等人的 Gravitation (W. H. Freeman, 1973) 本质上相同,在阅读 完本书后可以将 Gravitation 作为后续教材之一。自然 Gravitation 也影响了本书的物理观点视角 与主题阐释,这一部分是因为 Thorne 曾是我的老师,一部分也是因为 Gravitation 是一本很有影 响力的教材。但由于我试图让更为广泛的读者理解将广义相对论这一主题,因此两本书的风格与教 学方式是极为不同的。 关于本书的使用。虽然本书的设计是在一年的课程中按顺序学习整本书,但是可以将其压缩以 适应半年的课程。比如说对于已经学过电磁波的学生,在半年中致力于引力波与黑洞的教学是合适 的,这时要审慎地跳过第 1-3 章的部分内容和第 4、7、10 三章的大部分内容。再比如对于拥有狭 义相对论与流体力学预备知识的学生,可以在半年中学完恒星结构与宇宙学,这时可以快速地讲授 前四章并跳过第 9、11 两章。当然,讲授研究生课程时可以快得多,应当可以在半年内覆盖整本教 材。 每一章后面都有一套习题,难度从零碎的习题(补全书中正文所缺少的步骤,使用新引入的数 学方法)到很大程度上拓展了本书所讨论内容的高级问题。某些习题需要使用可编程计算器或计算 机。选些题做的重要性再怎么强调都不为过。前半部分各章中的简单题和中等题给是基本练习,不 做这些习题将很难理解后续各章。后半部分各章中的中等题和难题可以检验学生对广义相对论的 理解。一个非常常见的现象是,学生发现相对论的概念框架十分有趣,而将解题下放到第二位。这 种将物理概念与解题相分离的做法是错误而危险的, 不会求解一定难度习题的学生并不能真正理解 理论概念。书中的习题数量一般会比学生应做的更多,有几章有 30 多到习题,教师必须仔细选择 习题。Lightman 等人的 Problem Book in Relativity and Gravitation, (Princeton University Press, 1975) 也是一本丰富的习题来源。 我要感谢许多人对本书直接或间接的帮助。我想特别感谢我在 Cardiff 大学的本科生们,他们 对这门学科的热情,以及对早期讲义中不足的忍耐,鼓励我将讲义变成了一本书。我当然还要感谢 Suzanne Ball、Jane Owen、Margaret Vallender、Pranoat Priesmeyer 和 Shirley Kemp,他们耐心 地录入了我陆续写作的手稿。 5这本经典著作的修订第二版是 Will (1993)。
  6. D raft T ranslation Contents 1 狭义相对论 1 1.1 狭义相对论

    (SR) 基本原理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 SR 中惯性观测者的定义 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.3 新单位制 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.4 时空图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.5 构造其他观测者的坐标系 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.6 间隔不变性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.7 不变双曲线 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.8 几个重要结论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.9 Lorentz 变换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.10 速度叠加律 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.11 悖论,物理直觉 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.12 扩展阅读 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.13 附录:详述双生子佯谬 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.14 习题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2 狭义相对论中的向量分析 3 2.1 向量的定义 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2.2 向量代数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2.3 四维速度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.4 四维动量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.5 标量积 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.6 应用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.7 光子 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.8 扩展阅读 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2.9 习题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 3 狭义相对论中的张量分析 21 3.1 度规张量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 3.2 张量的定义 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 3.3 ( 0 1 ) 张量:1 形式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 3.4 ( 0 2 ) 张量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 9
  7. D raft T ranslation 10 CONTENTS 3.5 度规乃向量到 1 形式之映射也

    . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 3.6 终曲: ( M N ) 张量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.7 指标“升”“降” . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.8 张量的微分 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3.9 扩展阅读 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 3.10 习题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 4 狭义相对论中的理想流体 41 4.1 流体 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 4.2 尘埃系统:数流密度向量 ⃗ N . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 4.3 1 形式与表面 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 4.4 还是尘埃系统:应力-能量张量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 4.5 一般流体 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 4.6 理想流体 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 4.7 对于广义相对论的重要性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 4.8 高斯定律 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 4.9 扩展阅读 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 4.10 习题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 5 曲率的序言 63 5.1 引力与曲率的关系 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 5.2 极坐标系的张量代数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 5.3 极坐标系的张量微积分 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 5.4 Christoffel 符号与度规 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 5.5 非坐标基 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 5.6 展望下一步 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 5.7 扩展阅读 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 5.8 习题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 6 弯曲流形 85 6.1 微分流形,张量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 6.2 Riemannian 流形 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 6.3 协变微分 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 6.4 平行移动,测地线,曲率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 6.5 曲率张量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 6.6 Bianchi 恒等式:Ricci 张量与 Einstein 张量 . . . . . . . . . . . . . . . . . . . . . . 103 6.7 Curvature in perspective . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 6.8 扩展阅读 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 6.9 习题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
  8. D raft T ranslation 0 CONTENTS 7 弯曲时空中的物理学 107 7.1

    微分几何与引力理论的对应 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 7.2 轻微弯曲时空的物理学 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 7.3 Curved intuition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 7.4 守恒量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 7.5 扩展阅读 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 7.6 习题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 8 爱因斯坦场方程 117 8.1 场方程的 Purpose and justification . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 8.2 爱因斯坦方程 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 8.3 弱引力场的爱因斯坦方程 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 8.4 牛顿引力场 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 8.5 扩展阅读 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 8.6 习题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 9 引力辐射 131 10 星体的球对称解 133 10.1 球对称时空中的坐标 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 10.2 静态球对称时空 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 10.3 静态理想流体的 Einstein 方程 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 10.4 外部的几何 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 10.5 星体的内部结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 10.6 严格的内部解 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 10.7 相对论性星体和引力塌缩 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 10.8 扩展阅读 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 10.9 习题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 11 Schwarzschild 几何与黑洞 151 12 宇宙学 153 12.1 宇宙学是什么? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 12.2 宇宙运动学:观测膨胀宇宙 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 12.3 宇宙动力学:理解膨胀宇宙 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 A 线性代数的简要总结 159
  9. D raft T ranslation Chapter 1 狭义相对论 1.1 狭义相对论 (SR)

    基本原理 1.2 SR 中惯性观测者的定义 1.3 新单位制 1.4 时空图 1.5 构造其他观测者的坐标系 1.6 间隔不变性 1.7 不变双曲线 1.8 几个重要结论 1.9 Lorentz 变换 ¯ t = t √ 1 − v2 − vx √ 1 − v2 , ¯ x = −vt √ 1 − v2 + x √ 1 − v2 , ¯ y = y, ¯ z = z. (1.1) 1
  10. D raft T ranslation 2 CHAPTER 1. 狭义相对论 1.10 速度叠加律

    1.11 悖论,物理直觉 1.12 扩展阅读 1.13 附录:详述双生子佯谬 1.14 习题
  11. D raft T ranslation Chapter 2 狭义相对论中的向量分析 2.1 向量的定义 我们暂时采用欧几里得几何的向量定义:向量的分量在坐标变换下与坐标的变换规律相同。

    后 面会用更好的方式定义向量。 最典型的向量是位移向量,它从一个事件指向另一事件,分量等于事件的坐标差: ∆⃗ x − → O (∆t, ∆x, ∆y, ∆z). (2.1) 上式引入了一些新记号:向量用符号之上的箭头表示(例如 ⃗ x 表示一个向量,它与坐标 x 没 有特殊关系) ,∆⃗ x 之后的右箭头意味着“具有分量” ,右箭头下方的 O 意味着“在坐标系 O” ,坐标的 顺序总是 t, x, y, z(对应于数字指标 0, 1, 2, 3) 。符号 − → O 是为了强调区别向量本身与向量分量。向 量 ∆⃗ x 是两事件之间的箭头,而向量分量是一组四个依赖于坐标系的数字。为了强调向量(以及之 后的张量)的概念,我们称它们为几何对象 (geometrical object):也就是不依赖于特定坐标系 定义的东西。另一种重要的记号是 ∆⃗ x − → O {∆xα}, (2.2) 其中 {∆xα} 代表所有 ∆x0, ∆x1, ∆x2, ∆x3。为了表示这个向量在另一个坐标系 ¯ O 的分量,我们 写为 ∆⃗ x − → ¯ O {∆x¯ α}. 也就是带 bar 的坐标系对应的分量指标上面也带 bar。向量 ∆⃗ x 自身是不变的,不需要随着更换坐 标系而采用新记号,只有分量需要改变。1 新分量 ∆x¯ α 等于什么?利用 Lorentz 变换可以求出它 1这是有些线性代数教材所说的“被动”变换:坐标改变了,而向量没变。 3
  12. D raft T ranslation 4 CHAPTER 2. 狭义相对论中的向量分析 们: ∆x¯

    0 = ∆x0 √ 1 − v2 − v∆x1 √ 1 − v2 , 等等。 Lorentz 变换是线性的,上式可以写为 ∆x¯ 0 = 3 ∑ β=0 Λ¯ 0 β ∆xβ, 其中 {Λ¯ 0 β } 表示四个数,对应于 β 取 0123,在上述情形中 Λ¯ 0 0 = 1 √ 1 − v2 , Λ¯ 0 1 = − v √ 1 − v2 , Λ¯ 0 2 = Λ¯ 0 3 = 0. ∆x¯ 1 以及其它分量同理可得,这些结果可以表示为 ∆x¯ α = 3 ∑ β=0 Λ¯ α β ∆xβ, ∀ ¯ α. (2.3) 其中 {Λ¯ α β } 是 16 个数的集合,它们是 Lorentz 变换的矩阵元,把指标写成上下并且错开的理由在 之后学习微分几何的时候就会看到。下面来引入最后一个新记号——爱因斯坦求和约定:如果一 个表达式含有相同的上下标,则自动意味着对该指标求和。例如 Aα Bα 和 TγEγα 是如下求和式的简写: 3 ∑ α=0 Aα Bα 和 3 ∑ γ=0 TγEγα . 而 Aα Bβ, TγEβα , Aβ Aβ 不表示对任何指标的求和。Lorentz 变换(2.3)式简写为 ∆x¯ α = Λ¯ α β ∆xβ, (2.4) 这省了很多麻烦。 注意(2.4)式同样可以写为 ∆x¯ α = Λ¯ α γ ∆xγ,
  13. D raft T ranslation 2.1. 向量的定义 5 因为只要是重复的上下指标(不论是 β 还是

    γ)都代表从 0 到 3 的求和,重复的指标本身是什么 无所谓。这种重复表示求和的指标称为哑指标 (dummy index)(又称为傀儡指标) ,重命名哑指 标(例如上面把 β 换成 γ)是张量代数的常用技巧。注意不能用拉丁字母替换 β,因为我们约定重 复的拉丁字母指标表示对指标 1, 2, 3(空间部分)求和,而重复的希腊字母(例如 β)表示对所有 指标 0, 1, 2, 3 求和。因此,表达式 Λ¯ α β ∆xβ和Λ¯ α i ∆xi 并不相同,实际上 Λ¯ α β ∆xβ = Λ¯ α 0 ∆x0 + Λ¯ α i ∆xi. (2.5) (2.4)式表示了 4 个方程,对应于 ¯ α = 0, 1, 2, 3。像 ¯ α 这样不进行求和的指标称为自由指标 (free index)。一个含有自由指标的方程只有对自由指标的每个取值都成立的时候才成立。与哑指 标相似,自由指标也比较自由,例如(2.4)式可以写为 ∆x¯ γ = Λ¯ γ β ∆xβ, 上式与(2.4)式相同,因为 ¯ γ, ¯ α 都有四个取值都表示四个方程。如果方程中一处的自由指标改变了, 则处处都要改变,例如(2.4)式的如下修改是错误的: ∆x¯ γ = Λ¯ α β ∆xβ, 以上两式的差别在于,前者保证了无论 ¯ γ 取什么值,等号两侧的 ∆x¯ γ 和 Λ¯ γ β 总是对应相同的自 由指标。第二的式子没有这种关系,因此它与(2.4)式不一样。 一般地,向量 (vector)2(在坐标系 O 的分量)定义为一组数: ⃗ A − → O (A0, A1, A2, A3) = {Aα}, (2.6) 并且向量分量的变换规律与坐标的变换规律相同,向量在 ¯ O 系的分量的满足: A¯ α = Λ¯ α β Aβ. (2.7) 向量可以在某个坐标系中给定四个数字(例如 (108, −10−16, 5.8368, π))来定义;给定了一个 坐标系的分量之后,该向量在其它坐标系的分量也唯一确定。时空中的向量服从通常的运算规则: 如果 ⃗ A, ⃗ B 是向量,µ 是常数,则 ⃗ A + ⃗ B 与 µ ⃗ A 都是向量,它们的分量分别为 ⃗ A + ⃗ B − → O (A0 + B0, A1 + B1, A2 + B2, A3 + B3), µ ⃗ A − → O (µA0, µA1, µA2, µA3).      (2.8) 2这种有四个分量的向量有时称为四维向量以区分三维空间的三维向量。除非特别指出,我们所说的“向量”都是指四维向 量,我们用箭头表示四维向量,例如 ⃗ A,而用斜黑体表示三维向量,例如 A.
  14. D raft T ranslation 6 CHAPTER 2. 狭义相对论中的向量分析 即向量按照通常的平行四边形法则相加。注意在一个坐标系给定四个数就定义了一个向量,如果这 些数具有量纲,则它们的量纲必须相等,这样才能够在坐标变换时相加。

    2.2 向量代数 基向量 任意惯性系 O 都有 4 个特别的向量,利用它们在 O 系的分量进行定义: ⃗ e0 − → O (1, 0, 0, 0), ⃗ e1 − → O (0, 1, 0, 0), ⃗ e2 − → O (0, 0, 1, 0), ⃗ e3 − → O (0, 0, 0, 1).                      (2.9) 它们是坐标系 O 的基向量。类似地, ¯ O 系的基向量为 ⃗ e¯ 0 − → ¯ O (1, 0, 0, 0), 等等。 一般而言 ⃗ e¯ 0 ̸= ⃗ e0 ,因为它们在不同的坐标系定义。读者不难验证上述基向量的定义等价于 (⃗ eα )β = δ β α . (2.10) 也就是说,⃗ eα 的 β 分量是 Kronecker δ 符号:如果 β = α 则为 1,如果 β ̸= α 则为 0。 任何向量可以表示为基向量的线性组合,任意向量 ⃗ A 在 O 系的分量为 ⃗ A − → O (A0, A1, A2, A3), 则 ⃗ A = A0⃗ e0 + A1⃗ e1 + A2⃗ e2 + A3⃗ e3 , ⃗ A = Aα⃗ eα . (2.11) 其中最后一行利用了求和约定(⃗ e 的指标是下标正是为此) 。(2.11)式的含义是向量 ⃗ A 是四个 向量 A0⃗ e0 , A1⃗ e1 , . . . 的线性和。 基向量的变换 (2.11)式对任意坐标系都成立,在 ¯ O 系中: ⃗ A = A¯ α⃗ e¯ α .
  15. D raft T ranslation 2.2. 向量代数 7 这意味着 ⃗ A

    也是四个向量 A¯ 0⃗ e¯ 0 , A¯ 1⃗ e¯ 1 , . . . 之和,这四个向量与(2.11)式中的四个向量不同,因为它 们与 ¯ O 系的基向量平行而非与 O 系的基向量平行。尽管不同,但是它们的和等于同一个向量 ⃗ A。 注意,Aα⃗ eα 与 A¯ α⃗ e¯ α 并非简单地重命名哑指标,带 bar 与不带 bar 的指标不能互换,因为它们的 含义不同。{A¯ α} 与 {Aα} 不同的两组数,就像 {⃗ e¯ α } 与 {⃗ eα } 是两组不同的向量那样。但是,根据 定义,它们的和相同: Aα⃗ eα = A¯ α⃗ e¯ α , (2.12) 上式有一个重要推论:从它可以导出基向量的变换规律,也就是 {⃗ e¯ α } 与 {⃗ eα } 之间的关系。利 用(2.7)式可以将(2.12)写为 Λ¯ α β Aβ⃗ e¯ α = Aα⃗ eα . 等号左侧进行了两次求和。因为求和的各项都是有限的,因此求和次序无所谓。而由于 Λ¯ α β 和 Aβ 都只是数字,因此它们的顺序可以改变,上式可以写为 AβΛ¯ α β ⃗ e¯ α = Aα⃗ eα . β 和 ¯ α 都是哑指标,可以把 β 换成 α,¯ α 换成 ¯ β: AαΛ¯ β α ⃗ e¯ β = Aα⃗ eα . 上式化为 Aα(Λ¯ β α ⃗ e¯ β − ⃗ eα ) = 0, ⃗ A 是任意向量,上式对所有 {Aα} 都成立,由此可得 Λ¯ β α ⃗ e¯ β − ⃗ eα = 0, ∀ α, 或者写成 ⃗ eα = Λ¯ β α ⃗ e¯ β . (2.13) 这就是基向量的在坐标变换下的变换规律。它不同于向量分量的变换律:上式将 O 系的基向 量 {⃗ eα } 表示为 ¯ O 系的基向量 {⃗ e¯ α } 的线性组合。上式与(2.7)式 A¯ α = Λ¯ α β Aβ 比较可得,它们确实不一样。 上面的推导过程使用了一些新技巧,读者应该仔细掌握。注意求和规则省略了求和符号使得
  16. D raft T ranslation 8 CHAPTER 2. 狭义相对论中的向量分析 方程很整洁。还要注意推导过程的关键步骤在于哑指标重命名:它将彼此孤立的任意向量分量 Aα

    与方程的其余内容联系起来。 例 设 ¯ O 系相对于 O 系以速度 v 沿 x 轴运动,Lorentz 变换矩阵 [Λ¯ β α ] 为 (Λ¯ β α ) =         γ −vγ 0 0 −vγ γ 0 0 0 0 1 0 0 0 0 1         , 其中利用了标准记号 γ := 1 √ 1 − v2 . 如果 ⃗ A − → O (5, 0, 0, 2),则 ⃗ A 在 ¯ O 系的分量为: A¯ 0 = Λ¯ 0 0 A0 + Λ¯ 0 1 A1 + . . . = γ · 5 + (−vγ) · 0 + 0 · 0 + 0 · 2 = 5γ. 类似地可以算出 A¯ 1 = −5vγ, A¯ 2 = 0, A¯ 3 = 2. 因此 ⃗ A − → ¯ O (5γ, −5vγ, 0, 2). 基向量的变换律是 ⃗ eα = Λ¯ β α ⃗ e¯ β , 或者展开写成 ⃗ e0 = Λ¯ 0 0 ⃗ e¯ 0 + Λ¯ 1 0 ⃗ e¯ 1 + . . . = γ⃗ e¯ 0 − vγ⃗ e¯ 1 .
  17. D raft T ranslation 2.2. 向量代数 9 类似可得 ⃗ e1

    = −vγV e¯ 0 + γ⃗ e¯ 1 , ⃗ e2 = ⃗ e¯ 2 , ⃗ e3 = ⃗ e¯ 3 . 这样用 ¯ O 系的基向量表示了 O 的基向量。我们在 ¯ O 系中画出了示意图(如图2.1) :变换律保证 了变换后的基向量沿着相应的坐标轴,可以将图2.1与图 1.5(b) 进行比较。 图 2.1: 在 ¯ O 系中画出 O 系和 ¯ O 系的基向量。 逆变换 洛伦兹变换 Λ¯ β α 只依赖于两个坐标系之间的相对速度,下面将这种依赖关系写明: Λ¯ β α = Λ¯ β α (v). 于是 ⃗ eα = Λ¯ β α (v)⃗ e¯ β . (2.14) 如果 O 的基向量是通过 ¯ O 的基向量经过速度 v 对应的 Lorentz 变换得到的,那么逆变换必然是 (−v) 对应的,即: ⃗ e¯ µ = Λν ¯ µ (−v)⃗ eν . (2.15) 上式采用新的 ¯ µ, ν 以避免与上上式混淆,带 bar 的指标仍然是指 ¯ O 系。矩阵 [Λν ¯ µ ] 是矩阵 [Λ¯ β α ] 将 v 替换成 −v 得到的。指标上的 bar 只是用来标记观测者:变换矩阵 [Λ] 相应的速度(v 或者 −v) 总是上标对应的坐标系相对于下标对应的坐标系的速度。这在(2.14)和(2.15)式特别清楚, v 是 ¯ O 系((2.14))式的上标坐标系)相对于 O 系的速度;而 −v 是 O 系((2.15)式的上标坐标系)相 对于 ¯ O 系的速度。本章习题 11 帮助读者进一步理解这一点。
  18. D raft T ranslation 10 CHAPTER 2. 狭义相对论中的向量分析 (2.15)式可以写为 ⃗

    e¯ β = Λν ¯ β (−v)⃗ eν . 上式只是把 ¯ µ 替换成了 ¯ β,方程的含义没有任何改变,同样是 ¯ β 的四个值对应四个方程。上式带 入 ⃗ eα 的表达式(2.14)式中: ⃗ eα = Λ¯ β α (v)⃗ e¯ β = Λ¯ β α (v)Λν ¯ β (−v)⃗ eν . (2.16) 上式只出现了 O 的基向量。因此它必然是对所有 v 成立的恒等式。等式右侧含有两个求和,对 ¯ β 和对 ν 的。先计算对 ¯ β 的求和,则等号右侧就是 {⃗ eν } 的线性组合,每个 ⃗ eν 对应的线性系数为: ∑ ¯ β Λ¯ β α (v) Λν ¯ β (−v). (2.17) 考虑(2.16)式中的某个固定的 α,等号成立意味着等号右侧的 ⃗ eα 的系数必须为 1,而其余系数必须 为 0。用数学形式表示为 Λ¯ β α (v) Λν ¯ β (−v) = δν α , 其中 δν α 是 Kronecker delta 符号,这样可以导出 ⃗ eα = δν α ⃗ eν , 它是个恒等式。 更换相乘顺序,将上面的关键公式写为 Λν ¯ β (−v) Λ¯ β α (v) = δν α . (2.18) 上式意味着矩阵 [Λν ¯ β (−v)] 和矩阵 [Λ¯ β α (v)] 互逆,因为对 ¯ β 的求和意味着两个矩阵相乘。矩 阵 (δν α ) 就是单位矩阵。 向量分量的变换式 A¯ β = Λ¯ β α (v) Aα, 也有相应的逆形式。等号两侧乘以 Λν ¯ β (−v),对 ¯ β 求和: Λν ¯ β (−v) A¯ β = Λν ¯ β (−v) Λ¯ β α (v) Aα = δν α Aα = Aν.
  19. D raft T ranslation 2.3. 四维速度 11 这意味着 ⃗ A

    在 O 系的分量等于 ¯ O 系的分量经过速度 −v 对应的 Lorentz 变换得到,我们得到了 正确结论。 上述内容与读者熟悉的欧几里得空间中的向量代数类似,只是这里采用了新的指标记号,这种 记号在本书其余的部分大用特用。读者应该掌握上述内容的几何意义以及代数依据。 2.3 四维速度 世界线的四维速度(four-velocity, 简称四速)是一种十分重要的向量。伽利略的三维几何中, 速度是与粒子运动轨迹相切的向量。四维几何的四维速度 ⃗ U 定义为与粒子世界线相切的、在粒子 的参考系中长度为单位时间的向量。先考虑最简单的匀速直线运动粒子,在与粒子相对静止的惯性 系中,根据定义,四维速度向量的方向与时间轴平行、长度为单位时间,这意味着四维速度就等于 该系的基向量 ⃗ e0 。于是,匀速直线运动粒子的四维速度定义为该粒子静止惯性系的基向量 ⃗ e0 . “四 维速度”名字的来历是 ⃗ U 的空间分量与通常所说的粒子的三维速度 p 关系密切,参见下面的例子 与(2.21)式。 变速运动的粒子不存在始终在其中静止的惯性系。然而,仍然存在着与粒子瞬时静止的惯性系 ——它的速度在一瞬间与粒子速度相同(共动参考系) ,不过在下一时刻就不再是共动的了。这个 参考系称为瞬时共动参考系 (momentarily comoving reference frame, MCRF ),这个概念极其重 要。 (实际上,一个粒子在某一特定事件点有无数个 MCRF;它们的速度相同,而空间坐标轴相差 旋转变换。不过这通常不重要,取哪个空间轴取向的 MCRF 都行)变速运动粒子(在某一事件点) 的四速定义为在该事件点的 MCRF 的基向量 ⃗ e0 . 该向量与(弯曲的)粒子世界线相切。图2.2中, 粒子在事件 A 的 MCRF 是 ¯ O 系,图中画出了基向量,⃗ e¯ 0 就是粒子在 A 点的四速 ⃗ U. 图 2.2: 粒子世界线在 A 点的四维速度与 MCRF 基向量 2.4 四维动量 四维动量 ⃗ p 定义为 ⃗ p = m⃗ U, (2.19)
  20. D raft T ranslation 12 CHAPTER 2. 狭义相对论中的向量分析 其中 m

    是粒子的静止质量 (rest mass,简称静质量),也就是在粒子静止的坐标系中测得的粒 子质量。四动量在任一惯性系 O 中的分量记作 ⃗ p − → O (E, p1, p2, p3). (2.20) 分量 p0 记作 E,称为粒子在坐标系 O 中的能量 (energy)。其余分量称为四动量的空间分量 pi. 例子 静质量为 m 的粒子在坐标系 O 中沿 x 轴方向运动,速度为 v,粒子四速、四动量在 O 系的 分量是什么?粒子在其中静止的坐标系记作 ¯ O,该系的时间基向量为 ⃗ e¯ 0 。根据四速与四动量的定 义有 ⃗ U = ⃗ e¯ 0 , ⃗ p = m⃗ U, Uα = Λα ¯ β (⃗ e¯ 0 )¯ β = Λα ¯ 0 , pα = mΛα ¯ 0 . (2.21) 由此可得 U0 = (1 − v2)−1/2, p0 = m(1 − v2)−1/2, U1 = v(1 − v2)−1/2, p1 = mv(1 − v2)−1/2, U2 = 0, p2 = 0, U3 = 0, p3 = 0. 对于很小的 v,⃗ U 的空间分量近似为 (v, 0, 0),⃗ p 的空间分量为 (mv, 0, 0),从这就能看出它们的名 字——四维速度、四维动量——的合理性。还是对于很小的 v,能量近似为: E := p0 = m(1 − v2)−1/2 ≈ m + 1 2 mv2. 它等于静质能 (rest-mass energy) 与(伽利略形式的)动能之和。 四维动量守恒 伽利略力学中,粒子的碰撞过程遵从能量、动量守恒定律。因为 ⃗ p 的分量在非相对论极限下 退化为伽利略形式的能量、动量,因此很自然地假设在相对论情形下,四维向量 ⃗ p 也守恒。也就是 说,几个粒子发生相互作用,粒子的总动量: ⃗ p := ∑ 所有粒子,编号为(i) ⃗ p(i) , (2.22) 在碰撞过程的前后不变。 (⃗ p(i) 是第 i 个粒子的动量) 四维动量守恒定律实际上是个额外假设,因为我们只知道它的非相对论极限是正确的。不过就 像 SR 的两条基本假设那样,四动量守恒经历了丰富的实验验证。至少它预言了能量守恒定律必须
  21. D raft T ranslation 2.4. 四维动量 13 包括静质能:静质量可以消灭、相应的能量可以转化为动能从而化为热能。这个预言每天都在被核 电站所验证。 上面四动量守恒的陈述中掩藏了很重要的一点:一次碰撞“之前”与“之后”的含义是什么?假设

    不同的粒子发生了两次碰撞,这两个事件的间隔是类空的,如下图。要将同一时刻的四动量相加, 应该沿着等 t 时刻还是等 ¯ t 时刻?如图2.3所示,O 系的测量结果为:事件 A 发生在 t = 0 之前, 事件 B 在之后,因此 t = 0 时刻的总动量等于 A 之后加上 B 之前的动量。而在 ¯ O 系中,事件 A , B 同时发生于时刻 ¯ t = 0 之前, 因此 ¯ t = 0 时刻的总动量等于事件 A , B 之后的动量之和。 甚至 还可以找到一个坐标系,在其中事件 B 比 A 发生的更早,and the adding-up may be the reverse of O’s. 图 2.3: 当考虑几个碰撞过程时,组成某一时刻的总动量的各个四动量取决于坐标系,但总的四维动量是在所有坐标系中相同的四维向量; 它的分量在坐标系之间的变换规律服从 Lorentz 变换。 这实际上没问题。既然每个碰撞过程都服从动量守恒,那么事件 A 之后与之前的动量和相等, 事件 B 也一样。因此每个惯性观者都得到相同的总的四动量 ⃗ p。 (它的分量随坐标系的不同而不同, 但是它是同一个向量。 )有一点很重要:任意观者可以定义他自己的等时线(这实际上是等时的三 维空间,称之为四维时空中等时的超平面) ,把那个时刻的所有动量相加,得到的向量与其他任何 观者的结果都相同。理解这一点十分重要,因为这种守恒律会在之后再次出现。 质心 (CM) 系 质心系 (center of momentum frame, CM) 是总动量的空间分量在其中为零的惯性系: ∑ i ⃗ p(i) − − → CM (ETOTAL , 0, 0, 0). (2.23) 与 MCRF 同理,任意相对于 CM 系静止的坐标系也是 CM 系。
  22. D raft T ranslation 14 CHAPTER 2. 狭义相对论中的向量分析 2.5 标量积

    四维向量的模 类比间隔的定义,四维向量 ⃗ A 的模 (magnitude) 定义为 ⃗ A2 = −(A0)2 + (A1)2 + (A2)2 + (A3)2. (2.24) 根据向量分量的定义,向量分量在坐标变换下与 (∆t, ∆x, ∆y, ∆z) 的变换规律相同,服从 Lorentz 变换,这就保证了 −(A0)2 + (A1)2 + (A2)2 + (A3)2 = −(A¯ 0)2 + (A¯ 1)2 + (A¯ 2)2 + (A¯ 3)2. (2.25) 向量的模就定义成这样的不依赖于坐标系的量,即 Lorentz 变换下的标量 (scalar)。 向量模不一定是正数。我们把向量按照间隔那样进行分类: • 如果 ⃗ A2 是正数,则称 ⃗ A 是类空 (spacelike) 向量; • 如果 ⃗ A2 等于零,则称 ⃗ A 是 null 向量3; • 如果 ⃗ A2 是负数,则称 ⃗ A 是类时 (timelike) 向量。 这样,空间中的向量的模是正数,就像欧几里得空间的情况那样。必须注意,null 向量不同于 zero 向量。也就是说,null 向量满足 ⃗ A2 = 0,但它的所有 Aα 不一定都为零;而 zero 向量的所有分量 都是零。只有在 ⃗ A2 均为正定 (positive-definite) 的空间中, ⃗ A2 = 0 才意味着 ∀ α, Aα = 0. 两个向量的标量积 向量 ⃗ A, ⃗ B(在某个惯性系 O)的标量积 (scalar product) 定义为 ⃗ A · ⃗ B = −A0B0 + A1B1 + A2B2 + A3B3. (2.26) 下面来证明这个标量积在其它惯性系也是同样的值。 首先注意到 ⃗ A· ⃗ A 就是 ⃗ A2, 我们已经知道后者是个坐标变换下的不变量。 因此 ( ⃗ A+ ⃗ B)·( ⃗ A+ ⃗ B), 即 ⃗ A + ⃗ B 的模,也是不变量。根据(2.24)和(2.26)式可得 ( ⃗ A + ⃗ B) · ( ⃗ A + ⃗ B) = ⃗ A2 + ⃗ B2 + 2 ⃗ A · ⃗ B. 因为等号左侧的项以及右侧的前两项在所有坐标系中相等,因此最后一项也在所有坐标系中相等。 这就证明了向量积是坐标系不变量。 如果 ⃗ A · ⃗ B = 0,则称向量 ⃗ A 与 ⃗ B 垂直 (orthogonal)。标量积定义中的负号意味着相互垂直的 两个向量不一定非得在时空图中成直角(见下文的例子) 。一种极端情况是 null 向量,它与自身垂 直!这种现象在标量积是正定的空间中不会出现。 3通译为“零向量”,然而这个名字给人一种钦定的所有分量都为零的感觉,事实上并非如此(例如向量 (1, 1, 0, 0) 的模 ( − (1)2 + 12 ) = 0. 因此我们不采用“零向量”的译法,暂时称呼它为“null 向量” 。
  23. D raft T ranslation 2.5. 标量积 15 例 1 O

    系的基向量满足: ⃗ e0 · ⃗ e0 = −1, ⃗ e1 · ⃗ e1 = ⃗ e2 · ⃗ e2 = ⃗ e3 · ⃗ e3 = +1, ⃗ eα · ⃗ eβ = 0, 如果 α ̸= β. 因此它们组成了一组相互正交的向量四元组:一组规范正交基,这意味着这组基的所有基向量相 互正交并且归一化——具有单位模. (类空向量的“单位模”意味着模为 −1.)上式可以总结为 ⃗ eα · ⃗ eβ = ηαβ , (2.27) 其中 ηαβ 和 Kronecker δ 符号有点像——当 α ̸= β 时 ηαβ = 0,但有所不同:η00 = −1, η11 = η22 = η33 = +1. 后面会看到 ηαβ 的地位极其重要:它是度规张量。不过现在把它当作 Kronecker δ 的推广就好了。 例 2 ¯ O 系的基向量也满足 ⃗ e¯ α · ⃗ e¯ β = η¯ α ¯ β , 因此 ⃗ e¯ 0 · ⃗ e¯ 1 = 0. 考虑图2.4中的时空图:图中的 ⃗ e¯ 0 ,⃗ e¯ 1 看起来不垂直。然而它们的标量积等于零。 如果两个向量与 45◦ 倾斜的直线(光的世界线)的夹角相等,那么这两个向量垂直。因此,与光的 世界线相切的向量与自身垂直。这是 SR 中不能用欧几里得空间类比的又一个概念。 图 2.4: 在 O 系之下, ¯ O 系的基向量(用欧几里得空间的眼光)看起来并不“垂直” ,但是它们在 Minkowski 时空的向量积定义下却是 正交的。 例 3 粒子的四维速度 ⃗ U 就是粒子 MCRF 的基向量,因此根据(2.27)式可得 ⃗ U · ⃗ U = −1. (2.28)
  24. D raft T ranslation 16 CHAPTER 2. 狭义相对论中的向量分析 2.6 应用

    四速与四加速的导数形式 设粒子进行了无穷小位移 d⃗ x,d⃗ x 在 O 系的分量是 (dt, dx, dy, dz)。根据(2.24)式,无穷小位 移的模等于 −dt2 + dx2 + dy2 + dz2. 与(??)式进行比较,可以发现这就是间隔 ds2: ds2 = d⃗ x · d⃗ x. (2.29) 因为粒子世界线是类时的,因此上式各项为负数。这启示我们(方程(??))定义固有时 (proper time) dτ 为 (dτ)2 = −d⃗ x · d⃗ x. (2.30) 图 2.5: 与粒子世界线相切的无穷小位移向量 d⃗ x. 下面来考虑向量 d⃗ x/dτ,其中 dτ 等于方程(2.30)的平方根(如图2.5) 。这个向量与世界线相 切,因为它是 d⃗ x 的倍数。它的模等于 d⃗ x dτ · d⃗ x dτ = d⃗ x · d⃗ x (dτ)2 = −1. 因此它是与世界线相切的、单位模长的类时向量。在 MCRF 中: d⃗ x − − − − − − − − − → MCRF,dτ=dt (dt, 0, 0, 0). 因此 d⃗ x dτ − − − − → MCRF (1, 0, 0, 0), 从而有 d⃗ x dτ = (⃗ e0 )MCRF .
  25. D raft T ranslation 2.6. 应用 17 上式右侧就是四维速度的定义。由此可得如下的常用表达式: ⃗ U

    = d⃗ x dτ . (2.31) 进一步再考虑 d⃗ U dτ = d2⃗ x dτ2 , 这有一种四维加速度的感觉。我们对方程(2.28)式进行微分,并利用(2.26)式可得 d dτ (⃗ U · ⃗ U) = 2⃗ U · d⃗ U dτ . 因为 ⃗ U · ⃗ U = −1,是个常数,因此 ⃗ U · d⃗ U dτ = 0. 由于在 MCRF 中,⃗ U 只有 0 分量,因此上式的正交性意味着 d⃗ U dτ − − − − → MCRF (0, a1, a2, a3). 这个向量定义为四维加速度向量,记作 ⃗ a: ⃗ a = d⃗ U dτ , ⃗ U · ⃗ a = 0. (2.32) 本章习题 19 说明了为啥叫它“加速度” 。 能量与动量 考虑一个动量为 ⃗ p 的粒子, ⃗ p · ⃗ p = m2 ⃗ U · ⃗ U = −m2. (2.33) 由于 ⃗ p · ⃗ p = −E2 + (p1)2 + (p2)2 + (p3)2.
  26. D raft T ranslation 18 CHAPTER 2. 狭义相对论中的向量分析 因此 E2

    = m2 + 3 ∑ i=1 (pi)2. (2.34) 这是粒子总能量的常用表达式。 某观测者以四速 ⃗ Uobs 运动,他在其中静止的坐标系记作 ¯ O,观者的四速可以不等于粒子四速。 ⃗ p · ⃗ Uobs = ⃗ p · ⃗ e¯ 0 , 其中 ⃗ e¯ 0 是 ¯ O 系的基向量,在该系中粒子四动量的分量为 ⃗ p − → ¯ O ( ¯ E, p¯ 1, p¯ 2, p¯ 3). 于是,根据(2.26)式可得: −⃗ p · ⃗ Uobs = ¯ E. (2.35) 这个结果超级重要。它表明,粒子相对于观测者的能量 ¯ E 可以在任意坐标系中通过计算标量 积 ⃗ p · ⃗ Uobs 得到,这称为相对于观测者的能量的“坐标系无关”的表达式。它在大多数情形下都很有 用。 2.7 光子 光子无四速 光子在时空图的轨迹是 null 直线(即切向量都是 null 向量的直线) ,即,光子世界线轨迹满足 d⃗ x · d⃗ x = 0. (2.36) 因此 dτ 为零。方程(2.31)表明光子四速不能定义。导出该结论的另一种方式是注意到不存在光子 在其中静止的坐标系(根据 SR 的第二个假设) ,因此光子没有 MCRF。所以没有哪个坐标系的 ⃗ e0 会与光子世界线相切。 注意,仍然可以找到与光子轨迹相切的向量(光子世界线轨迹为直线,它每一点的切向量相 等) :d⃗ x 就是一个。问题是找不到单位模长的切向量,因为所有切向量的模等于零。 四动量 粒子的四动量不是单位向量。粒子四动量在某个坐标系的分量是粒子在那个系中的能量、动 量。如果光子在某坐标系中的能量为 E,则在该系中 p0 = E。如果光子在该系中沿 x 轴方向运动, 则 py = pz = 0,由于四动量必须与光子世界线平行,因此光子四动量必须是 null 向量,从而有
  27. D raft T ranslation 2.7. 光子 19 px = E,这保证了

    ⃗ p · ⃗ p = −E2 + E2 = 0. (2.37) 由此可得,光子四动量空间部分 (spatial momentum) 的大小等于它的能量。 量子力学表明,光子的能量为 E = hν, (2.38) 其中 ν 是光子频率、h 是 Planck 常量,h = 6.6256 × 10−34 J s。 这个关系式结合四动量的 Lorentz 变换可以得到光子的 Doppler 频移公式。例如,某个光子在 O 系中的频率为 ν,沿 x 方向运动。则在 ¯ O 系中(它相对于 O 系沿 x 轴以速度 v 运动)的光子 能量为: ¯ E = E √ 1 − v2 − pxv √ 1 − v2 = hν √ 1 − v2 − hνv √ 1 − v2 . 结合 ¯ E = h¯ ν 可得到光子在 ¯ O 系中的频率的关系: ¯ ν ν = 1 − v √ 1 − v2 = √ 1 − v 1 + v . (2.39) 一般情况的频移公式见本章习题 25. 静质量为零的粒子 光子的静质量为零,因为: m2 = −⃗ p · ⃗ p = 0. (2.40) 四动量为 null 向量的任意粒子静质量必然为零,反之亦然。目前已知静质量为零的唯一粒子是光 子。中微子很轻,但并非无质量。(有时无质量粒子也包括“引力子” ,因为后面会看到,引力波 以光速传播。但是“光子”与“引力子”都是来自量子力学的概念,而目前没有合适的引力量子化 理论,因此“引力子”还不是一个有良好定义的概念。 ) 将有限大小静质量的粒子加速到光速需要 无穷大的能量,因此只有静质量为零的粒子才能以光速运动。另一种说明方法是,一个以光速运动 的粒子(简明起见设它沿 x 方向运动)满足 p1/p0 = 1,而静质量为 m、沿 x 轴运动的粒子,根据 ⃗ p · ⃗ p = −m2,有 p1/p0 = [ 1 − m2/(p0)2 ]1/2,无论给该粒子多少能量,这个比值总是小于 1。尽管 可以让静质量非零的粒子无限接近光速,但存在着质的不同:m ̸= 0 的粒子总是有 MCRF——即 粒子在该系中静止的 Lorentz 系(惯性系) ,它相对于旧坐标系的速度 v = p1/p0. 而光子没有静止 坐标系。
  28. D raft T ranslation 20 CHAPTER 2. 狭义相对论中的向量分析 2.8 扩展阅读

    本章简要阐述了相对论运动学及粒子动力学的内容。它们在粒子物理学中特别重要,这也为 SR 提供了最严格的检验。详见 Hagedorn (1963) 或者 Wiedemann (2007)。 2.9 习题
  29. D raft T ranslation Chapter 3 狭义相对论中的张量分析 3.1 度规张量 向量

    ⃗ A, ⃗ B 在某个坐标系 O 的基向量 {⃗ eα } 当中表示为: ⃗ A = Aα⃗ eα , ⃗ B = Bβ⃗ eβ . 它们的标量积为 ⃗ A · ⃗ B = (Aα⃗ eα ) · (Bβ⃗ eβ ), (注意要用不同的哑指标 α, β 表示两个求和。 ) 根据第2章习题 34,上式可以化为 ⃗ A · ⃗ B = AαBβ(⃗ eα · ⃗ eβ ), 再由(2.27)式可得 ⃗ A · ⃗ B = AαBβηαβ . (3.1) 上式是 (−A0B0 + A1B1 + A2B2 + A3B3) 的坐标系不变性的表示法。ηαβ 称为“度规张量的 分量”,后面会说明这个名字。度规提供了将两个张量 ⃗ A, ⃗ B 结合为一个数字的“规则”——二重求和 AαBβηαβ 。这种规则是“张量”的核心含义,下面就来讨论。 3.2 张量的定义 张量的定义: ( 0 N ) 张量是将 N 个向量变成实数的函数,并且它对这 N 个参数都是线性的。 21
  30. D raft T ranslation 22 CHAPTER 3. 狭义相对论中的张量分析 这个定义的含义是什么?现在只需要暂时接受符号 (

    0 N ) ,它的含义在本章后面解释。(3.1)式的标 量积规则符合上面的 ( 0 2 ) 张量的定义,这个规则描述了如何将两个向量 ⃗ A, ⃗ B 变成一个实数 ⃗ A · ⃗ B。 第2章习题 34 证明了线性性, ⃗ A · ⃗ B 对第一个参数的线性性意味着 (α ⃗ A) · ⃗ B = α( ⃗ A · ⃗ B), 以及( ⃗ A + ⃗ B) · ⃗ C = ⃗ A · ⃗ C + ⃗ B · ⃗ C,    (3.2) 而对第二个参数的线性性意味着 ⃗ A · (β ⃗ B) = β( ⃗ A · ⃗ B), ⃗ A · ( ⃗ B + ⃗ C) = ⃗ A + ⃗ B + ⃗ A · ⃗ C. 线性性在张量代数中位于重要的核心地位,读者要仔细理解。 为了具体表示点积产生的张量, 我们引入相应的名称与符号。 g 称为度规张量 (metric tensor), 定义为 g( ⃗ A, ⃗ B) := ⃗ A · ⃗ B. (3.3) g( , ) 视为两个参数的线性函数: g(α ⃗ A + β ⃗ B, ⃗ C) = αg( ⃗ A, ⃗ C) + βg( ⃗ B, ⃗ C), (3.4) 第二个参数同理。g 作用于两个参数的值——记作 g( ⃗ A, ⃗ B)——是它们的点积,也就是一个实数。 注意,张量的定义没有涉及向量分量。张量是一种规则,无论在哪个坐标系计算向量的分量, 这种规则总给出相同的、与坐标系无关的实数。上一章已经证明了(3.1)式符合这个要求。张量是向 量本身、而非向量分量的函数,这一点有时在概念上十分有帮助。 特典:数学术语“函数 (function)”的使用说明 最熟悉的函数记号是表达式 y = f(x), 其中 y, x 是实数。上式更精确的说法是,f 是一种“规则” (称为“映射”) ,它将一个实数(符号为 y) 与另一个实数 (符号为 x) ——f 的参数相联系。函数本身不是 f(x),因为 f(x) 就是 y(一个实数, 称为函数的“值”) 。函数本身的符号应该是 f,为了强调它有一个参数,也可以记作 f( )。 在代数学中, 上述内容有点吹毛求疵, 因为 x, y 被视为同时有两种含义:一种是特定实数, 另一 种是一般而任意的实数的代称。在张量微积分中, 应该把符号说明清楚: ⃗ A, ⃗ B 表示特定向量,⃗ A· ⃗ B 是特定实数,符号 g 是将 ⃗ A · ⃗ B 与 ⃗ A, ⃗ B 联系起来的函数的名字。 张量的分量 就像向量那样,张量也有分量,其定义为: ( 0 N ) 张量在坐标系 O 的分量,是该张量作用于 O 系基向量 {⃗ eα } 的函数值。
  31. D raft T ranslation 3.3. ( 0 1 ) 张量:1

    形式 23 可见,张量分量是依赖于坐标系(因为上述定义涉及了具体坐标系)的实数。根据定义,度规张量 的分量为 g(⃗ eα ,⃗ eβ ) = ⃗ eα · ⃗ eβ = ηαβ . (3.5) 因此,之前引入的矩阵 ηαβ 可以视为度规张量 g 在相应坐标基下的分量排列成的矩阵。另一 组基下的张量分量可能不同,后面会列举相关例子。下面首先来研究一类重要的张量。 3.3 ( 0 1 ) 张量:1 形式 ( 0 1 ) 张量称为余向量 (covector)、协变向量 (covariant vector) 或者 1 形式 (one-form),这些名 字都很常用,同一文献或教材中也会交替使用它们。 一般性质 设 ˜ p 是一个任意的 1 形式。 (用符号˜表示 1 形式,就像用⃗ 表示向量那样。 )˜ p 将一个向量作 为参数,输出一个实数:˜ p( ⃗ A)。设 ˜ q 是另一个 1 形式,定义 1 形式的加法与数乘 ˜ s = ˜ p + ˜ q, ˜ r = α˜ p, 为: (参数 ⃗ A 是任意向量) ˜ s = ˜ p( ⃗ A) + ˜ q( ⃗ A), ˜ r = α˜ p( ⃗ A).    (3.6) 这样定义了加法与数乘的全体 1 形式构成的集合满足向量空间的定义,这个空间叫做“对偶向量空 间 (dual vector space)”以区分所有 ⃗ A 这样的向量组成的空间。 关于向量的重要内容是向量的分量以及分量变换律。下面来考虑 1 形式 ˜ p 的相应内容。˜ p 的 分量记作 pα : pα := ˜ p(⃗ eα ). (3.7) 按照惯例,任何带有单个下标的量都是 1 形式的分量;而上指标表示向量的分量。˜ p( ⃗ A) 用分量表 示为 ˜ p( ⃗ A) = ˜ p(Aα⃗ eα ) = Aα ˜ p(⃗ eα ), ˜ p( ⃗ A) = Aαpα . (3.8)
  32. D raft T ranslation 24 CHAPTER 3. 狭义相对论中的张量分析 第二个等式利用了张量定义的核心——线性性。由上式可见实数 ˜

    p( ⃗ A) 等于求和 A0p0 + A1p1 + A2p2 + A3p3 ,注意所有项都是正号,这种操作称为 ⃗ A 和 ˜ p 的缩并 (contraction),在张量分析中, 它是比标量积更重要的操作,因为缩并是在任意 1 形式与向量之间进行、不涉及其它张量的。前面 已经看到两个向量的标量积必须在第三个张量——度规——的帮助下进行。 ˜ p 在基 {⃗ e¯ β } 中的分量为 p¯ β : = ˜ p(⃗ e¯ β ) = ˜ p(Λα ¯ β ⃗ eα ) = Λα ¯ β ˜ p(⃗ eα ) = Λα ¯ β pα . (3.9) 上式与基向量的变换律比较: ⃗ e¯ β = Λα ¯ β ⃗ eα , 可见 1 形式分量与基向量的坐标变换律相同,而与向量分量相反。 “相反”的意思是互为逆变换。这 种互逆的变换保证了 Aαpα 对任意 ⃗ A, ˜ p 都是不依赖坐标系的量,这一性质十分重要,值得详细证 明: A¯ αp¯ α = (Λ¯ α β Aβ)(Λµ ¯ α pµ ), (3.10a) = Λµ ¯ α Λ¯ α β Aβpµ , (3.10b) = δµ β Aβpµ , (3.10c) = Aβpβ . (3.10d) (证明过程与 Aα⃗ eα 的坐标不变性证明相同。 )互逆的变换规律是“对偶向量空间”中“对偶”一词的来 历。 1 形式分量与基向量同样的变换规律是“协变向量”中“协变”的来历, “余向量”是简称。 因为向量分 量的变换规律与基向量相反 (为了保证 Aβ⃗ eβ 不变) , 所以向量分量被称作“逆变向量 (contravariant vector)”。这些名称大部分都是过时的, “向量”、 “对偶向量”和“1 形式”是现代名称。 “协变”“逆变”的说 法不被采纳的原因是, 它们混淆了两种非常不同的情况:基向量的变换是用旧基表示新的向量;分 量的变换是同一个量在新基中的表达式。读者在继续阅读之前一定要思考清楚这一点。 1 形式基 因为所有 1 形式的集合是向量空间,因此任意四个线性无关的 1 形式都是一组 1 形式基。 (线 性无关的 1 形式组:这组 1 形式的线性组合等于零 1 形式当且仅当所有线性系数为零。零 1 形式 作用于任意向量所得结果都是零。 )不过,上一小节已经利用基向量 {⃗ eα } 定义了 1 形式的分量,这 意味着可以利用基向量定义相应的 1 形式基 {˜ ωα, α = 0, . . . , 3},称它是与向量基 {⃗ eα } 对偶的 1 形式基,1 形式在这组基下的分量为上文定义的(3.7)式。我们要找到一组 {˜ ωα} 使得 ˜ p = pα ˜ ωα. (3.11)
  33. D raft T ranslation 3.3. ( 0 1 ) 张量:1

    形式 25 (注意 1 形式基 ˜ ωα 用上标表示从而与求和约定一致。 ){˜ ωα} 是四个不同的 1 形式,就像 {⃗ eα } 是 四个不同的向量那样。上式意味着对任意向量 ⃗ A 与 1 形式 ˜ p: ˜ p( ⃗ A) = pα Aα. 而根据(3.11)式可得 ˜ p( ⃗ A) = pα ˜ ωα( ⃗ A) = pα ˜ ωα(Aβ⃗ eβ ) = pα Aβ ˜ ωα(⃗ eβ ). 注意第二行的 ⃗ A 的求和哑指标为 β,与另一个哑指标 α 不同。 )最后一行要与 pα Aα 相等(对于 任意的 Aβ 和 pα ) ,因此 ˜ ωα(⃗ eβ ) = δα β . (3.12) 与方程(3.7)比较可以发现,上式给出了第 α 个 1 形式基的 β 分量,因此定义了第 α 个 1 形 式基,具体为: ˜ ω0 − → O (1, 0, 0, 0), ˜ ω1 − → O (0, 1, 0, 0), ˜ ω2 − → O (0, 0, 1, 0), ˜ ω3 − → O (0, 0, 0, 1). 下面指出两点重要内容。第一,方程(3.12)利用 {⃗ eβ } 定义了 1 形式基 {˜ ωα}。一组向量基可以导出 唯一的、方便的 1 形式基。当然,1 形式基不止这一组,但这组是最方便的,之后一直采用这组 基(3.12)。方程(3.12)表示的两组基之间的关系并非一对一的,例如 ˜ ω0 与 ⃗ e0 ,也就是说,如果改变 ⃗ e0 而其余的 ⃗ e1 ,⃗ e2 ,⃗ e3 不变,则一般而言,不仅 ˜ ω0 改变,而且 ˜ ω1, ˜ ω2, ˜ ω3 都变化。 第二,尽管向量与 1 形式都是通过给定四个分量来描述的,但是它们的几何意义非常不同。读 者务必牢记:分量只含有一部分内容,其余内容蕴含在基当中。即,一组数 (0, 2, −1, 5) 没有定义 任何东西,为了让它定义某个东西,必须说明它是在哪组向量基或者 1 形式基下的分量。 {˜ ωα} 在坐标变换下的变换律尚未推导。每个坐标系都有自己唯一的 {˜ ωα}, 不同的两个系之间 的 1 形式基的关系是什么?它的推导过程与向量基类似,其结果就是把指标位置做适当调整: ˜ ω¯ α = Λ¯ α β ˜ ωβ. (3.13) 这与向量分量的变换律相同,而与 1 形式分量的变换律相反。
  34. D raft T ranslation 26 CHAPTER 3. 狭义相对论中的张量分析 图 3.1:

    (a) 向量用箭头表示,作为互补,1 形式用一系列表面表示。(b) 1 形式作用于向量产生的值是箭头穿过的表面的数目。(c) 对于 同一个向量,作用与该向量产生的值越小的 1 形式对应的表面数目更少,1 形式越大,它的图像的空间切片越“密集” 。 1 形式的图像 向量通常用箭头来图像化表示,1 形式对应什么图像?首先,肯定不是箭头。1 形式的图像必 须体现出 1 形式是将向量变为数的映射,而向量自身并不能自动将另一个向量映射为数,必须要 有一个度规张量来定义标量积。在度规不同的情况下,相同的两个向量也会有不同的标量积。因此 两个向量自身不能产生一个数。1 形式的图像必须做到不依赖任何别的张量来将向量变成数。数学 家最常用的方案如图3.1所示。1 形式的图像是由一系列表面构成的。1 形式的“模”是由各表面的间 距体现的:模长越小的 1 形式图像的间距越大。在这种图像下,1 形式作用于向量产生的数体现在 向量的箭头穿过 1 形式表面的数量。因此表面间距越密,产生的数越大(如图3.1中的 (b) 与 (c)) 。 四维空间的表面是三维的。1 形式不是向量,并没有指示一个特定的方向,而是定义了空间的一种 “切片”方式。为了对此进行说明,我们来详细研究一个具体的 1 形式——梯度。 函数的梯度是 1 形式 考虑定义在所有事件 ⃗ x 处的标量场 ϕ(⃗ x)。某个粒子(或观测者)的世界线对应一系列的 ϕ 值 (如图3.2) ,不同的事件对应不同的 ϕ 值。如果将世界线上的点用沿着该世界线的固有时 τ(也就是 沿着该世界线的钟的走时)进行标记(参数化) ,则线上的事件的坐标可以表示为 τ 的函数: [ t = t(τ), x = x(τ), y = y(τ), z = z(τ) ] . 四速度的分量为 ⃗ U → ( dt dτ , dx dτ , . . . ) . 由于 ϕ 是 t, x, y, z 的函数,因此世界线上的 ϕ 间接是 τ 的函数: ϕ(τ) = ϕ [ t(τ), x(τ), y(τ), z(τ) ] ,
  35. D raft T ranslation 3.3. ( 0 1 ) 张量:1

    形式 27 图 3.2: 世界线用固有时 τ 参数化,标量场 ϕ(t, x, y, z) 沿世界线的值可以表示为 ϕ(τ). ϕ 沿着该曲线的变化率为 dϕ dτ = ∂ϕ ∂t dt dτ + ∂ϕ ∂x dx dτ + ∂ϕ ∂y dy dτ + ∂ϕ ∂z dz dτ = ∂ϕ ∂t Ut + ∂ϕ ∂x Ux + ∂ϕ ∂y Uy + ∂ϕ ∂z Uz . (3.14) 上式从向量 ⃗ U 产生的数 dϕ/dτ 的物理意义 ϕ 沿曲线(⃗ U 是它的切向量)的变化率。将向量 ⃗ U 变 成数 dϕ/dτ 的映射显然是线性的,因此上式定义了一个 1 形式。 上式与方程(3.8)比较可得,1 形式的分量为 (∂ϕ/∂t, ∂ϕ/∂x, ∂ϕ/∂y, ∂ϕ/∂z). 这个 1 形式称为 ϕ 的梯度,记作 ˜ dϕ: ˜ dϕ − → O ( ∂ϕ ∂t , ∂ϕ ∂x , ∂ϕ ∂y , ∂ϕ ∂z ) . (3.15) 容易验证它符合 1 形式的定义。这个量与三维欧几里得空间的向量分析中梯度的联系将在后文阐 述。 梯度有助于我们理解 1 形式的图像。图3.3是地形图的一部分,其中画出了等高线。高度记作 h,则梯度 ˜ dh 在图中的 A 区域附近(等高线密集)的模最大,而在 B 区域附近(等高线稀疏) 最小。要求出两点之间的高度差,只需在两点之间连线(向量 ∆⃗ x) ,高度差就是 ∆⃗ x 穿过的等高 线数目。例如,图3.3中的 1 号线穿过了 11 2 条等高线,2 号线穿过了 2 条等高线,3 号线在 2 号 线附近,但是方向不同,它只穿过了 1 2 条等高线。高度差记作 ∆h,它等于 ˜ dh 与 ∆⃗ x 的缩并: ∆h = ∑ i (∂h/∂xi)∆xi,或者说是 ˜ dh 作用于 ∆⃗ x 的值(方程(3.8)) 。 可见,1 形式可以用一系列表面表示(如图3.4) ,它与向量缩并的结果就是向量穿过的表面数 目。越大的 ˜ ω 的图像的表面越密集。就像向量的箭头是直的那样,1 形式的表面们是平直的、平行 的。这是因为我们处理的是某一点上的 1 形式,而非是在延伸区域上,它们就像切向量那样是“切” 1 形式。 1 形式的图像还可以解释为啥梯度一般而言不是向量。如果梯度是向量,那么我们期待它指向 单位长度位移造成高度变化最大的方向,问题在于“单位长度”。如果空间有度量距离的度规,那么 向量可以与梯度联系起来。梯度必须在度规的帮助下才能成为向量,它在几何上实际是 1 形式。
  36. D raft T ranslation 28 CHAPTER 3. 狭义相对论中的张量分析 图 3.3:

    解释 1 形式梯度的地形示意图(画出了恒定高度差的等高线) 。沿任意路径(箭头)的高度变化量等于箭头穿过的等高线数目。 图 3.4: ˜ ω(⃗ V ) 的值为 2.5。 下面来验证(3.15)是合适的 1 形式定义。它的分量如何变换?1 形式分量必须满足变换律 (˜ dϕ)¯ α = Λβ ¯ α (˜ dϕ)β . (3.16) 偏导数的变换规律为 ∂ϕ ∂x¯ α = ∂ϕ ∂xβ ∂xβ ∂x¯ α , 由此可得 (˜ dϕ)¯ α = ∂xβ ∂x¯ α (˜ dϕ)β . (3.17) (3.16)和(3.17)一致吗?当然一致,由于 xβ = Λβ ¯ α x¯ α , 并且 Λβ ¯ α 是常数,因此 ∂xβ ∂x¯ α = Λβ ¯ α . (3.18) 这个等式特别重要。梯度的分量按照向量分量的逆变换律变换,因此梯度的确是 1 形式。
  37. D raft T ranslation 3.4. ( 0 2 ) 张量

    29 导数符号 从现在起我们使用逗号 + 下标表示偏导数: ∂ϕ ∂x := ϕ,x 更一般的写法是 ∂ϕ ∂xα := ϕ,α . (3.19) 注意,指标 α 在等号左侧的分母中是上标,而在右侧是下标。前面已经验证过,这种指标的移动保 证了与变换律一致。 特别的, xα ,β ≡ δα β , 与(3.12)式进行比较可得 ˜ dxα := ˜ ωα . (3.20) 这个结论很有用,它意味着 1 形式基就是 ˜ dxα。由此可得,对于任意函数 f, ˜ df = ∂f ∂xα ˜ dxα . 上式看起来很像物理学家心中的微分或无穷小变化量的“不严谨”写法,符号 ˜ d 就是为了提示这一相 似之处,不过也要避免混淆。˜ df 是张量,而非 f 的微小增量;˜ df 在与一个小的向量缩并之后可以 产生一个小的(无穷小的)值。 法向 1 形式 梯度作为 1 形式比作为向量更加自然,法向量(与表面正交的向量)也是如此,它更自然的替 代者是法向 1 形式。法向量需要定义标量积:法向量的定义是与表面的所有切向量都正交的向量, 于是度规必须参与其中。但是法向 1 形式可以不依赖于度规地进行定义。与某个表面正交的 1 形 式(法向 1 形式)作用于该表面的所有切向量结果都为零。如果表面是闭合的并且将时空分为“内 部”和“外部”,那么外部法向 1 形式是这样一种特殊的法向 1 形式:它作用于任意指向表面外部的 向量的结果都大于零。本章习题 13 要证明 ˜ df 是等 f 面的法向 1 形式。 3.4 ( 0 2 ) 张量 ( 0 2 ) 张量有两个向量参数,前面遇到的度规就是这种张量,但是最简单的 ( 0 2 ) 张量是两个 1 形 式按照如下规则的“乘积” :设 ˜ p 与 ˜ q 是两个 1 形式,则 ˜ p ⊗ ˜ q 是 ( 0 2 ) 张量,它作用于向量 ⃗ A、⃗ B(顺 序不能颠倒)的结果是 ˜ p( ⃗ A) ˜ q( ⃗ B),即两个 ( 0 1 ) 张量分别作用于两个向量参数结果的乘积。符号 ⊗ 称为“外积符号” ,它体现了这种 ( 0 2 ) 张量是如何由 1 形式构造的。注意 ⊗ 不具有交换律:˜ p ⊗ ˜ q 与 ˜ q ⊗ ˜ p 是不同的张量,它们作用于参数 ⃗ A、 ⃗ B 的结果分别是 ˜ p( ⃗ A)˜ q( ⃗ B)、˜ q( ⃗ A)˜ p( ⃗ B).
  38. D raft T ranslation 30 CHAPTER 3. 狭义相对论中的张量分析 分量 普通的

    ( 0 2 ) 张量一般不是简单的低阶张量之外积, 但是总可以分解为这种外积张量之和。为此, 首先考虑任意的 ( 0 2 ) 张量 f 的分量: fαβ := f(⃗ eα ,⃗ eβ ) . (3.21) 每个指标有四个可能取值,因此一共有 16 个分量,可以认为它们组成一个 4 × 4 矩阵。f 作用于任 意向量的结果为 f( ⃗ A, ⃗ B) = f(Aα⃗ eα , Bβ⃗ eβ ) = AαBβf(⃗ eα ,⃗ eβ ) = AαBβfαβ . (3.22) (注意不同的求和使用了不同的哑指标以避免混淆。 ) 我们能否构造 ( 0 2 ) 张量的一组基?也就是说, 能否定义 16 个 ( 0 2 ) 张量 {˜ ωαβ} 使得类似(3.11)式 的关系 f = fαβ ˜ ωαβ (3.23) 成立? 如果上式成立,那么由此可得 fµν = f(⃗ eµ ,⃗ eν ) = fαβ ˜ ωαβ(⃗ eµ ,⃗ eν ) , 这意味着 ˜ ωαβ(⃗ eµ ,⃗ eν ) = δα µ δβ ν . (3.24) 根据(3.12)式,δα µ 是 ˜ ωα 作用于 ⃗ eµ 的结果,δβ ν 同理。因此,˜ ωαβ 是两个 1 形式基的外积: ˜ ωαβ = ˜ ωα ⊗ ˜ ωβ . (3.25) 可见张量 ˜ ωα ⊗ ˜ ωβ 是 ( 0 2 ) 张量的基, f = fαβ ˜ ωα ⊗ ˜ ωβ . (3.26) 这是一般的 ( 0 2 ) 张量表示为外积张量之和的一种方式。
  39. D raft T ranslation 3.4. ( 0 2 ) 张量

    31 对称性 ( 0 2 ) 张量有两个参数,前面已经看到,参数的顺序很重要。在参数的顺序改变的情况下,张量 的值如何变化是它的重要性质。张量 f 是对称的,如果: f( ⃗ A, ⃗ B) = f( ⃗ B, ⃗ A), ∀ ⃗ A, ⃗ B . (3.27) 取 ⃗ A = ⃗ eα , ⃗ B = ⃗ eβ ,上式意味着 fαβ = fβα . (3.28) 将分量排列成矩阵,可见上式就是对称矩阵的条件。从任意的 ( 0 2 ) 张量 h 可以按照下式定义一个 对称张量: h (s) ( ⃗ A, ⃗ B) = 1 2 h( ⃗ A, ⃗ B) + 1 2 h( ⃗ B, ⃗ A) . (3.29) 不难验证 h (s) 满足(3.27)式。上式的分量形式为 h(s)αβ = 1 2 (hαβ + hβα ) . (3.30) 这种对称张量是有用的,值得用符号标记: h(αβ) := 1 2 (hαβ + hβα ) . (3.31) h(αβ) 是从一般的 h 构造的对称张量的分量。 类似地,f 是反对称的,如果 f( ⃗ A, ⃗ B) = −f( ⃗ B, ⃗ A), ∀ ⃗ A, ⃗ B, (3.32) fαβ = −fβα . (3.33) 从任意 ( 0 2 ) 张量 h 总可以构造如下反称张量: h (A) ( ⃗ A, ⃗ B) = 1 2 h( ⃗ A, ⃗ B) − 1 2 h( ⃗ B, ⃗ A) , h(A)αβ = 1 2 (hαβ − hβα ) . 这种反称张量用带方括号的指标标记: h[αβ] = 1 2 (hαβ − hβα ) . (3.34)
  40. D raft T ranslation 32 CHAPTER 3. 狭义相对论中的张量分析 注意 hαβ

    = 1 2 (hαβ + hβα ) + 1 2 (hαβ − hβα ) = h(αβ) + h[αβ] . (3.35) 因此任意 ( 0 2 ) 张量可以惟一地分解为它的对称部分与反称部分之和。 度规张量 g 是对称的,因为从(2.26)可以导出 g( ⃗ A, ⃗ B) = g( ⃗ B, ⃗ A) . (3.36) 3.5 度规乃向量到 1 形式之映射也 本节将要介绍,度规是向量与 1 形式之间的映射,在之后微分几何的部分会发现,这是度规的 基本角色。考虑度规 g 以及向量 ⃗ V ,由于 g 有两个向量参数,因此表达式 g(⃗ V , ) 仍然需要一个向 量:在补上一个向量参数之后就得到一个数。因此,g(⃗ V , ) 可以视为将向量变成实数的线性映射: 也就是 1 形式。将这个 1 形式称为 ˜ V : g(⃗ V , ) := ˜ V ( ) , (3.37) 括号中的空格意味着需要放入向量参数。1 形式 ˜ V 将向量 ⃗ A 映射为 ⃗ V · ⃗ A: ˜ V ( ⃗ A) := g(⃗ V , ⃗ A) = ⃗ V · ⃗ A . (3.38) 由于 g 是对称的,因此还可以写为 g( , ⃗ V ) := ˜ V ( ) . ˜ V 的分量是啥?不难计算: Vα := ˜ V (⃗ eα ) = ⃗ V · ⃗ eα = ⃗ eα · ⃗ V = ⃗ eα · (V β · ⃗ eβ ) = (⃗ eα · ⃗ eβ )V β . Vα = ηαβ V β . (3.39) 注意,向量 ⃗ V 的分量 V α 与 ˜ V 的分量 Vα 只有指标的位置不同:向量分量是上标、1 形式分
  41. D raft T ranslation 3.5. 度规乃向量到 1 形式之映射也 33 量是下标。根据(3.39)式,

    V0 = V βηβ0 = V 0η00 + V 1η10 + . . . = V 0(−1) + 0 + 0 + 0 = −V 0 , (3.40) V1 = V βηβ1 = V 0η01 + V 1η11 + . . . = +V 1 , (3.41) 可以总结为: 如果 ⃗ V → (a, b, c, d) , 那么 ˜ V → (−a, b, c, d) . (3.42) 要得到 ˜ V 的分量,只需把 ⃗ V 的时间分量反号、其余分量不变即可。 (它们的关系依赖于度规分量 ηαβ ,在后面度规分量更复杂的情况下,⃗ V 与 ˜ V 的分量之间的关系更加复杂。 ) 反向:从 ˜ A 到 ⃗ A 度规能否提供从向量 ⃗ A 到 1 形式 ˜ A 的联系?可以。考虑方程(3.39),它表明 {Vα } 是由矩阵 (ηαβ ) 乘以 {V β} 得到的,如果 (ηαβ ) 有逆矩阵,那么就能从 {V β} 回到 {Vα }。矩阵可逆的条件是 行列式非零,(ηαβ ) 是对角矩阵 (−1, 1, 1, 1),它的行列式是 −1。因此逆矩阵存在,将它记作 ηαβ。 于是,给出 {Aβ } 可以得到 {Aα}: Aα := ηαβAβ . (3.43) 逆矩阵保证了(3.39)式的关系仍然成立: Aβ = ηβα Aα . 因此度规 g 提供的向量与 1 形式之间的映射是一对一并且是可逆的。 特别地,梯度 ˜ dϕ 对应的向量是 ⃗ dϕ,这个向量是多元微积分中的梯度。这个向量与等 ϕ 面正 交,论证如下:⃗ dϕ 与等 ϕ 面中向量的内积,按照定义,等于 1 形式 ˜ dϕ 作用于该向量的值 ˜ dϕ(⃗ V ) ——也就是 ϕ 沿着 ⃗ V 方向的变化率,再因为 ⃗ V 是等 ϕ 面的向量,因此 ˜ dϕ(⃗ V ) 等于零。 {ηαβ} 的具体形式有必要求出。容易验证 η00 = −1, η0i = 0, ηij = δij, (3.44) 因此 (ηαβ) 与 (ηαβ ) 全同。因此从 1 形式变到向量也只需要将时间分量反号即可。
  42. D raft T ranslation 34 CHAPTER 3. 狭义相对论中的张量分析 为啥要区分 1

    形式和向量? 欧几里得空间的直角坐标系对应的度规就是 {δij },因此 1 形式与向量的分量相等,因此普通 的向量分析不区分它们。但是狭义相对论中二者的分量不同 (时间分量异号) 。例如, 梯度的分量为 ˜ dϕ → ( ∂ϕ ∂t , ∂ϕ ∂x , . . . ) , 相应的向量——等 ϕ 面的法向量的分量为 ⃗ dϕ → ( − ∂ϕ ∂t , ∂ϕ ∂x , . . . ) . (3.45) 其实也可以不讨论 1 形式、硬要定义“梯度向量”的分量为如上形式,只是这么干的话时间分量的负 号会显得十分生硬。狭义相对论的非欧(几里得)度规迫使必须正视 1 形式与向量的根本性不同, 不能把这种差异藏到地毯下面。 前面已经看到,向量与 1 形式相互对偶。这种对偶空间十分重要,并且在数学物理中经常见 到。最简单的例子是矩阵代数中的列向量空间      a b . . .      , 它的对偶空间是行向量 (a b . . . )。它们的内积 (a b . . . )      p q . . .      = ap + bq + . . . (3.46) 是实数,因此行向量可以视为 1 形式,它作用于列向量得到实数。从一个空间的元素找到另一个空 间中对应的元素,这一操作称为“adjoint”,它是一一对应且可逆的。不那么平凡的例子来自量子力 学。波函数(概率幅、薛定谔方程的解)是复标量场 ψ(⃗ x),所有的这种函数组成的空间是希尔伯特 空间。希尔伯特空间也是向量空间,它的元素满足向量空间的公理。它的对偶空间是什么?关键的 线索在于任意两个波函数 ϕ(⃗ x)、ψ(⃗ x) 的内积并非 ∫ ϕ(⃗ x)ψ(⃗ x)d3x,而是 ∫ ϕ∗(⃗ x)ψ(⃗ x)d3x,其中星 号是指复共轭。函数 ϕ∗(⃗ x) 就像 1 形式,它作用于 ψ(⃗ x) 的方式是与它相乘再积分(类比(3.8)式的 求和) 。取复共轭的操作就像度规张量, 将 (希尔伯特空间的) 向量 ϕ(⃗ x) 变成 1 形式 ϕ∗(⃗ x)。实际上 ϕ∗(⃗ x) 也是希尔伯特空间的函数, 不过这对于目前的问题来说是容易混淆的事情。 (就像 (1, −1, 0, 0) 说成是向量或者 1 形式的分量那样。 )重要的地方在于积分 ∫ ϕ∗(⃗ x)ψ(⃗ x)d3x 当中的函数 ϕ∗(⃗ x) 就 像 1 形式,它将 ψ(⃗ x) 变成了一个(复)数。这种对偶性用狄拉克的左矢、右矢符号表述更加方便。 希尔伯特空间中的元素用符号 | ⟩ 标记(例如 |ψ⟩) ,而对偶空间(adjoint with complex conjugate) 的元素用 ⟨ | 标记。两个“向量”|1⟩ 和 |2⟩ 不能产生一个数,而向量 |1⟩ 与 1 形式 ⟨2| 可以产生数字 ⟨2|1⟩. 对偶向量空间的概念经常出现在高等数学物理当中。
  43. D raft T ranslation 3.5. 度规乃向量到 1 形式之映射也 35 1

    形式的模与标量积 1 形式 ˜ p 的模定义为相应的向量 ⃗ p 的模,因此 ˜ p2 = ⃗ p2 = ηαβ pαpβ . (3.47) 根据上式, 似乎计算 1 形式的模需要先计算相应的向量分量, 但其实不需要。 利用方程(3.43)将(3.47)式 中的 pα 与 pβ 化为: ˜ p2 = ηαβ (ηαµpµ )(ηβνpν ) . (3.48) (注意不同的求和用了不同的哑指标。 )由于 ηαβ 与 ηβν 互逆,因此对指标 β 求和的结果为: ηαβ ηβν = δν α . (3.49) 带入(3.48)可得 ˜ p2 = ηαµpµ pα . (3.50) 因此,利用逆度规张量可以直接从 1 形式的分量计算模。根据(3.44)式将上式写成显式形式: ˜ p2 = −(p0 )2 + (p1 )2 + (p2 )2 + (p3 )2 . (3.51) 这与向量模的运算律(2.24)相同。由定义不难验证 1 形式模也是不依赖坐标系的,1 形式的类时、 类空或类光性由它对应的向量的性质确定。 就像向量的内积那样,定义 1 形式之间的内积为 ˜ p · ˜ q := 1 2 [ (˜ p + ˜ q)2 − ˜ p2 − ˜ q2 ] . (3.52) 上式展开成分量形式为 ˜ p · ˜ q = −p0 q0 + p1 q1 + p2 q2 + p3 q3 . (3.53) 法向量与单位法向 1 形式 表面的法向量是指,该向量对应的 1 形式是该表面的法向 1 形式。方程(3.38)展示了这个定义 与通常的说法——与表面的所有切向量都正交——相符合。法向量或法向 1 形式称为单位法向, 如 果它的模长为 ±1。 (不能只取 +1,因为类时向量的模长为负。任何向量都能乘以因子使得模长变 成 ±1.)注意类光法向量/1 形式不能变成单位长度。 如果一个表面的法向量是类空/类时/类光的,则称该表面是是类空/类时/类光的。 (本章习题 12 证明了这个定义是自洽的。 )本章习题 21 要证明法向量因为度规而具有奇特性质。外法向量是 外法向 1 形式对应的向量,于是外法向量与任意指向外部的向量的标量积都为正。如果表面是类
  44. D raft T ranslation 36 CHAPTER 3. 狭义相对论中的张量分析 空的,那么外向法向量指向外侧。然而,如果表面是类时的,那么外法向量指向内侧。并且如果表 面是类光的,那么外法向量与该表面相切!这种奇怪的性质更加说明了法向

    1 形式比法向量更加 自然,因为法向 1 形式的定义不依赖度规。 3.6 终曲: ( M N ) 张量 向量作为 1 形式的函数 前文讨论的对偶性实际上可以再完善。尽管我们将 1 形式定义为向量的函数,但其实向量也 完全可以视为将 1 形式变成实数的线性映射。给定向量 ⃗ V ,它将 1 形式 ˜ p 按如下方式变成实数: ⃗ V (˜ p) ≡ ˜ p(⃗ V ) ≡ pα V α ≡ ⟨˜ p, ⃗ V ⟩ . (3.54) 于是,向量可以从“张量作用的参数”这一特殊位置上退下,并且可以将向量也视为一类张量——将 一个 1 形式变成实数的线性函数。(3.54)式的最后一个符号是新定义的,它强调了 1 形式与向量的 平等地位。 ( M 0 ) 张量 按照上述思想推广定义 ( M 0 ) 张量: ( M 0 ) 张量是将 M 个 1 形式变成实数的线性函数。 前述所有关于 ( 0 N ) 张量的讨论在这里都有效。最简单的 ( 2 0 ) 张量形如 ⃗ V ⊗ ⃗ W,它有两个参数 ˜ p 与 ˜ q,结果为实数 ⃗ V (˜ p) ⃗ W(˜ q) := ˜ p(⃗ V )˜ q( ⃗ W) = V αpα Wβqβ 。因此 ⃗ V ⊗ ⃗ W 的分量为 V αWβ。 ( 2 0 ) 张量的一组基为 ⃗ eα ⊗⃗ eβ 。 ( M 0 ) 张量的分量是它作用于 1 形式基 ˜ ωα 的值。注意 ( M 0 ) 张量的分量都 具有上指标。 ( M N ) 张量 最终推广的张量定义为: ( M N ) 张量是将 M 个 1 形式与 N 个向量变成实数的线性函数。 例如,如果 R 是 ( 1 1 ) 张量,那么它将一个 1 形式 ˜ p 与一个向量 ⃗ A 变成实数 R(˜ p; ⃗ A)。它的分 量为 R(˜ ωα;⃗ eβ ) := Rα β 。一般的 ( M N ) 张量的分量有 M 个上标与 N 个下标,张量分量在不同坐标 系之间的变换关系为 R¯ α ¯ β = R(˜ ω¯ α;⃗ e¯ β ) = R(Λ¯ α µ ˜ ωµ; Λν ¯ β ⃗ eν ) = Λ¯ α µ Λν ¯ β Rµ ν . (3.55) 可见分量的变换律很简单:每个指标都对应一个 Λ,指标排列通过求和约定以满足等号两侧平衡。 有些旧的名称依然被使用:上标称为“逆变指标” (因为它的变换方式与基向量的变换律相反) ,而下 标称为“协变指标”。 ( M N ) 张量的分量具有“M 个逆变指标”与“N 个协变指标” 。
  45. D raft T ranslation 3.7. 指标“升” “降” 37 循环论证? 阅读至此,有些读者会担心张量代数存在循环论证:1

    形式是用向量定义的,但现在又用 1 形 式定义了向量。这种“对偶性”其实是张量理论的核心,而且并非循环论证。我们可以像物理学家那 样将位移 ∆⃗ x 以及其他量(例如 ⃗ p 和 ⃗ v)作为向量,并且利用张量代数推广到所有 ( M N ) 张量;这 些张量继承了向量被赋予的原始的物理意义。此外,1 形式也可以与某些物理量联系起来(例如 1 形式)并利用张量代数得到高阶张量。数学的抽象性使得我们不需要知道原始的向量或 1 形式的 具体含义,而只是给出了这些量的运算律。数学对象与物理量的联系(例如 ⃗ p 与向量)是物理与数 学的交互,是利用数学模型描述物理世界的过程。几何学家的工作也是如此,他们对抽象的张量空 间补充了弯曲空间中的向量是什么。我们将在之后弯曲空间的部分学习现代几何学的向量。从现在 起,我们要在实际的物理情景中处理张量,目前暂时(不严谨地)把向量当作某种“类似”∆⃗ x 的东 西就好了。 3.7 指标“升” “降” 就像度规将向量 ⃗ V 映射为 1 形式 ˜ V 那样,它也可以将 ( N M ) 张量映射为 ( N−1 M+1 ) 张量。类似地, 度规的逆可以将 ( N M ) 张量映射为 ( N+1 M−1 ) 张量。这些映射前后的张量通常使用同样的名字,只是指 标位置不同。设 Tαβ γ 是一个 ( 2 1 ) 张量的分量,则 Tα βγ := ηβµ Tαµ γ (3.56) 是 ( 1 2 ) 张量的分量(将 Tαβ γ 的第二个 1 形式指标映射成向量) 。 T β α γ := ηαµ Tµβ γ (3.57) 是另一个(不一样的) ( 1 2 ) 张量(映射的是第一个指标) 。而 Tαβγ := ηγµTαβ µ (3.58) 是 ( 3 0 ) 张量的分量。这些操作很自然地称作指标“升”“降” ,它的意思是利用度规提供的映射。狭义相 对论中的升降规律是简单的:0 指标进行升降时,分量变号;1, 2, 3 指标(统称为 i 指标)升降时, 分量不变。 度规的混合分量 度规的分量是 {ηαβ },度规的逆的分量是 {ηαβ}。利用度规的逆提升 ηαβ 的一个指标,就得到 了度规的“混合”分量: ηα β ≡ ηαµηµβ . (3.59) 上式等号右侧就是两个互逆的矩阵相乘(对此不确定的读者可以自行验证) ,因此等于单位矩阵。 由于一个是上标、一个是下标,因此它等于克罗内克 delta 符号,写为
  46. D raft T ranslation 38 CHAPTER 3. 狭义相对论中的张量分析 ηα β

    ≡ δα β . (3.60) 再将另一个指标提升就得到了恒等式 ηαβ = ηαβ。因此可以将 ηαβ 视为 ( 2 0 ) 张量的分量,这 个张量是 mapped from the ( 0 2 ) tensor g by g−1。因此,对于 g 而言,它的“逆变”分量等于它的“协 变”分量矩阵的逆,只有度规张量才是这样。 度规与非度规向量代数 有人会问为啥将 1 形式与向量的联系起来的是度规,为啥不是其它可逆的 ( 0 2 ) 张量?下面分 步骤说明这一点。 首先,为啥要建立联系?如果已经有了“非度规”向量代数,具有对偶空间与 ( M N ) 张量,为啥要 在 1 形式与向量之间建立联系?答案是,有的情况需要联系,有时不需要。没有度规,向量之间的 内积无法定义,只有 1 形式作用于向量或者反过来才能产生数。标量积在物理学中很有用,因此度 规很有用。不过数学物理中的有些向量空间的度规不重要,例如经典力学和量子力学的相空间。 然后,为啥是度规而不是别的张量?如果不用某个度规而是用其它的对称张量定义 1 形式 与向量间的映射,那数学家就把这个张量称作度规,也就是把度规定义为产生映射的张量。用数 学语言来说,度规为向量代数添加了一些结构。数学中的不同空间可以由不同的度规结构。黎曼 (Riemannian) 空间的特征是其度规定义的向量模是正定的。狭义相对论的情况,模长符号是不定 的,称为伪黎曼空间。甚至可以定义反对称的“度规” :旋量空间(一种二维空间)的度规就是如此, 它在物理学中也十分重要,但是本书不讨论。我们想强调的是,如果只讨论向量与张量,那么不会 有狭义相对论,只有在加入分量为 ηαβ 的度规之后才能得到。如果度规采用别的分量,就会得到别 的空间,例如广义相对论中的弯曲时空。 3.8 张量的微分 函数 f 是 ( 0 0 ) 张量,它的梯度 ˜ df 是 ( 0 1 ) 张量。微分一个函数得到了高一阶(协变阶)的张量, 下面会看到这对任意阶的张量微分都成立。 考虑 ( 1 1 ) 张量 T,它的分量 {Tα β } 是坐标的函数,可以将 T 表示为 T = Tα β ˜ ωβ ⊗ ⃗ eα . (3.61) 仿照前面对函数的做法,T 沿着参数为固有时 τ 的世界线的变化率为 dT dτ = lim ∆τ→0 T(τ + ∆τ) − T(τ) ∆τ , (3.62) 这不难计算。由于各处的 1 形式基与向量基都相同(即 ˜ ωα(τ + ∆τ) = ˜ ωα(τ)) ,上式化为 dT dτ = ( dTα β dτ ) ˜ ωβ ⊗ ⃗ eα , (3.63)
  47. D raft T ranslation 3.9. 扩展阅读 39 其中 dTα β

    /dτ 是函数 Tα β 沿世界线的普通导数: dTα β dτ = Tα β,γ Uγ . (3.64) dT/dτ 是 ( 1 1 ) 张量,因为方程(3.62)就是两个 ( 1 1 ) 张量之差。根据(3.63)与(3.64)式可得,对于任意 向量 ⃗ U: dT dτ = (Tα β,γ ˜ ωβ ⊗ ⃗ eα )Uγ . (3.65) 由此可以推断 ∇T := (Tα β,γ ˜ ωβ ⊗ ˜ ωγ ⊗ ⃗ eα ) (3.66) 是 ( 1 2 ) 张量,这个张量称为 T 的梯度。 使用符号 ∇T 而非 ˜ dT 是因为数学家用后者表示别的东西。(3.65)式有更方便的符号: dT dτ = ∇⃗ U T , (3.67) ∇⃗ U T → {Tα β,γ Uγ} . (3.68) 上面的推导用到了各处的向量基与 1 形式基相同,后面会看到这对广义相对论的弯曲时空不成立, 并且考虑这一点是理论的关键之处! 3.9 扩展阅读 我们对张量代数的处理方式强调了张量的几何本质而非它们分量的变换性质。希望重点学习 后者的学生可以参考 Misner et al. (1973) or Schutz (1980b) 的前几章,或者 Bishop and Goldberg (1981). 大多数介绍张量而不涉及相对论的物理教材只讨论“笛卡尔”张量,即三维直角坐标系的张量分 量。例如 Bourne and Kendall (1991) 或者 Mathews Walker(1965) 的相关章节。 Schouten (1990) 是一本基于旧式的坐标变换讲述张量分析的详尽教材, 也可参考 Yano(1955)。 从这种处理张量的方式讨论相对论的书籍包括 Adler et al. (1975), Landau and Lifshitz (1962), and Stephani (2004). 3.10 习题
  48. D raft T ranslation Chapter 4 狭义相对论中的理想流体 4.1 流体 在相对论性天体物理中,

    许多引力场源可以用理想流体作为一阶近似。 一般而言, “流体 (fluid)” 是一种特殊的“连续介质 (continuum)”,连续介质是大量粒子组成的系统,无法跟踪单个粒子的运 动,而只能描述粒子集合的“平均”或者“集体”性质,例如单位体积的粒子数、能量密度、动量密度、 压强、温度等等。湖水以及它产生的引力场不取决于单个水分子的状态,而只依赖于大量分子的平 均性质。 然而,湖水的这种平均性质在各点可以不同:湖水底部的压强比上部更大,温度也随着深度变 化。大气(也是流体)密度随位置的改变而改变。这产生了一个问题:应该取多少粒子的平均才合 适。必须要取足够多的粒子,从而使得单个粒子的行为没有影响;但是也必须比较少,以保证相对 均匀性:取平均的粒子的速度、动能与粒子间距等等不能相差太大。这种合适的取平均的粒子集合 称为“流体元 (element)”。这是个不太精确但是很有用的概念,流体元包含大量粒子,它们的密度、 平均速度、温度等等的取值可以视为相同。如果这种合适的集合不存在 (例如极度稀薄的气体) , 则 连续介质近似失效。 连续介质近似将所有体元赋予了相应的密度、温度等等物理量的值,由于这些体元被视为“很 小的” ,则这种近似在数学上意味着在每一点赋予了密度、温度等等的值。也就是说,连续介质是由 在取值在每一时刻每一点的各种场来定义的。 连续介质的概念既包括岩石也包括气体。流体是“流动”的连续介质,这也是个不精确的定义, 固体与流体的区别因而也不十分清楚。大多数固体在压强足够大时也会流动。什么让物体保持坚 硬?是与两个体元界面平行的力。两个相邻体元可以互相挤压、拉伸,只有相邻体元不会沿分界面 滑动的连续体才是刚性的。流体的特征是,那种阻碍滑动的力(沿平行于界面方向)远小于垂直于 界面方向的力(称为压强) 。理想 (perfect) 流体是所有阻碍滑动的力为零的流体,理想流体相邻 体元之间的相互作用力只有压强。后面会用数学来精确描述这些性质。 4.2 尘埃系统:数流密度向量 ⃗ N 本节以最简单“尘埃”系统为例引入描述流体的相对论性物理量。 “尘埃 (dust)”系统由一组粒子 组成,这些粒子在某个 Lorentz 坐标系中处于静止。我不知道这种系统为啥起名叫做灰尘(窗台上 的东西) ,但是它是相对论的标准术语。 41
  49. D raft T ranslation 42 CHAPTER 4. 狭义相对论中的理想流体 图 4.1:

    Lorentz 收缩使得粒子数密度依赖于坐标系。 粒子数密度 n 对尘埃粒子最简单的问题是:单位体积内的粒子数是多少?在粒子静止的坐标系中,只需要 数一数有多少粒子并除以体积就好了。由于系统各处的粒子疏密程度可能不同,因此不同点附近的 小区域内的粒子数也会不同。定义数密度 (number density) n 为: n := 流体元的 MCRF 观测到的数密度。 (4.1) 粒子在其中运动的坐标系 ¯ O 观测到的数密度是什么?所有粒子在 ¯ O 系中具有共同的速度 v。同样 的一组粒子在静止坐标系中和 ¯ O 系观测的粒子数相同,而占据的体积不同。设在静止坐标系,这 组粒子占据长方形体积 ∆x ∆y ∆z,它在 ¯ O 系中 Lorentz 收缩为 ∆x ∆y ∆z √ 1 − v2,因为沿粒子 运动的方向长度收缩而垂直方向长度不变(如图4.1) 。因此, ¯ O 系的粒子数密度是静止系数密度乘 以 ( √ 1 − v2)−1: n √ 1 − v2 = { 粒子在其中速度为 v 的坐标系观测到的数密度 } . (4.2) 通过表面的流量 对于运动的粒子,另一个有趣的问题是,沿某一方向“有多少”粒子运动?相应的精确概念是“流 量 (flux)” :粒子通过一个平面的流量是单位时间通过单位面积表面的粒子数。显然,流量依赖于坐 标系(“面积”与“时间”都依赖于坐标系)以及表面的方向(平行于粒子速度的表面,其流量为零,因 为没有粒子通过它) 。 在尘埃系统的静止坐标系中流量为零,因为所有粒子静止。设在 ¯ O 系,所有粒子沿 ¯ x 方向以 速度 v 运动,先考虑垂直于 ¯ x 轴的平面(如图4.2) ,图中由虚线表示的立方体区域内的粒子就是 在时间 ∆¯ t 内通过 S 面的面积 ∆A 的粒子。这个区域的体积是 v∆¯ t ∆A,由于该系的数密度为 n/ √ 1 − v2,因此该区域的粒子数为 [n/ √ 1 − v2]v∆¯ t。单位时间内穿过等 ¯ x 面(S 面)单位面积 的粒子数,也就是通过等 ¯ x 面的流量为: (flux)¯ x = nv √ 1 − v2 .
  50. D raft T ranslation 4.2. 尘埃系统:数流密度向量 ⃗ N 43 图

    4.2: 流量变换律的简单图示:如果粒子只沿 x 轴运动,则在时间 ∆¯ t 通过 S 面的粒子位于距离 S 面 v∆¯ t 的范围内。 图 4.3: 流量的更一般情况:通过等 ¯ x 坐标面的流量只与粒子速度的 ¯ x 分量有关。 更一般的情况是, 粒子在 ¯ O 系中也有 ¯ y 方向的速度, 图4.3中,在 ∆¯ t 时间内通过 S 面的面积 ∆A 的粒子位于虚线区域内,该区域是“平行六面体”形状的,它的体积等于底乘以高,它的高—— ¯ x 方向的长度——等于 v¯ x ∆¯ t,由此可得 (flux)¯ x = nv¯ x √ 1 − v2 . (4.3) 数流密度四维向量 ⃗ N 定义向量 ⃗ N 为 ⃗ N = n⃗ U, (4.4)
  51. D raft T ranslation 44 CHAPTER 4. 狭义相对论中的理想流体 其中 ⃗

    U 是粒子四速。设在 ¯ O 系中粒子速度为 (vx, vy, vz),则有 ⃗ U − → ¯ O ( 1 √ 1 − v2 , vx √ 1 − v2 , vy √ 1 − v2 , vz √ 1 − v2 ) . 因此 ⃗ N − → ¯ O ( n √ 1 − v2 , nvx √ 1 − v2 , nvy √ 1 − v2 , nvz √ 1 − v2 ) . (4.5) 可见,在任意坐标系中,⃗ N 的时间分量是数密度,空间分量是通过不同坐标面的流量。这个概念超 级重要。在伽利略的物理学中,数密度是个在所有坐标系都相同的标量(没有 Lorentz 收缩) ,而 流量是很不一样的物理量:它是依赖于坐标系的三维向量,因为粒子速度依赖于坐标系。在相对论 中,数密度与流量被统一到同一个不依赖于坐标系的四维向量当中。这是思维方式最主要的一大进 步:将看起来无关的概念统一到一个量。 值得再次强调“不依赖于坐标系”的含义。向量 ⃗ N 是个几何量,它的存在不依赖于任何坐标系; 就像一般的张量那样, ⃗ N 将 1 形式映射为数字,与坐标系无关。它的分量确实依赖于坐标系。由 于相对论之前的物理学认为流量是三维向量,并且还依赖于坐标系:流量是三维向量,因为它与坐 标轴的指向无关(就像四维向量与坐标系无关那样) ;但是流量这种三维向量在相互运动的坐标系 中的分量不同,因为粒子的速度在这些坐标系中不同。对于旧物理学,流量向量必须在某个惯性系 定义。而相对论只需要定义一个向量,旧物理学中坐标依赖的定义方式是因为只考虑了 ⃗ N 的四个 分量中的三个。伽利略物理学中的坐标系无关量——数密度,和依赖于坐标系的量——流量,在相 对论中被统一到了一个不依赖坐标系的四维向量 ⃗ N 当中, 就像“能量”和“动量”被统一到了四维动量 中那样。 最后,根据定义显然有 ⃗ N · ⃗ N = −n2, n = (− ⃗ N · ⃗ N)1/2. (4.6) 可见 n 是个标量。就像“静质量”是标量,而能量与“惯性质量”依赖于坐标系那样, “静密度” (静 止坐标系观测到的粒子数密度)n 是标量,而“数密度”依赖于坐标系。n 总是定义为粒子的 MCRF 观测到的数密度,也就是一个标量。流体的压强、温度等其它特征量的定义也是如此,之后会讨论 它们。 4.3 1 形式与表面 数密度是一种类时流量 为了进一步完善上面数密度与流量的统一, 我们来论证数密度可以视为一种类时流量 (timelike flux)。还是先考虑通过等 ¯ x 坐标面的流量,在时空图中画出相应过程,如图4.4,图中只画出了 ¯ t 轴和 ¯ x 轴。 垂直于 ¯ x 轴的 S 面的世界线如图所示,由于省略了 ¯ y, ¯ z 轴,因此任意时刻 ¯ t 只对应一个点。 在时间 ∆¯ t 内通过 S 面的粒子的世界线是图中的倾斜直线,流量即为在时间间隔 ∆¯ t = 1 之内
  52. D raft T ranslation 4.3. 1 形式与表面 45 图 4.4:

    图4.2的时空图版本,其中省略了 ¯ y 轴。 图 4.5: 数密度可以视为通过等时面 ¯ t = 常数 的流量。 穿过 S 面的粒子世界线数目。实际上,由于 S 面是二维的,因此它的“世界轨迹”是三维的(“世 界体”) ,而图中只能画出一部分。流量是通过单位“体积”世界体的世界线数目:单位体积的含义是 边长为 1 单位的立方体 ∆¯ t = 1, ∆¯ y = 1, ∆¯ z = 1。因此,流量可以定义为通过三维世界体单位体 积的粒子世界线数目。同理,这种三维世界体也可以是某一时刻 ¯ t 对应的三维空间体的单位体积 ∆¯ x = 1, ∆¯ y = 1, ∆¯ z = 1,如图4.5。这样,流量就是通过 ∆¯ x = 1(∆¯ y, ∆¯ z 省略了)的世界线数目, 而它正是特定时刻的单位体积内的粒子数:数密度。因此“类时”流量是数密度。 一个 1 形式定义了一个表面 前文描述表面的方式有点笨拙。为了用更加具有不变性的方式描述,需要用一种数学概念来表 示粒子世界线所通过的表面,这要用到 1 形式。一般地,一个表面是由某个方程的解定义的: ϕ(t, x, y, z) = 常数。 函数 ϕ 的梯度 ˜ dϕ 是法向 1 形式。 某种程度上, ˜ dϕ 定义了表面 ϕ = 常数, 因为它唯一确定了表面的 法方向。然而, ˜ dϕ 的任意常数倍也定义了同样的表面, 因此一般采用单位法向 1 形式 (unit-normal
  53. D raft T ranslation 46 CHAPTER 4. 狭义相对论中的理想流体 one-form) 来描述

    not null 的表面: ˜ n := ˜ dϕ |˜ dϕ| , (4.7) 其中 |˜ dϕ|是˜ dϕ的模: |˜ dϕ| = |ηαβϕ,α ϕ,β |1/2. (4.8) (不要把 ˜ n 和 n 混淆,后者是 MCRF 观测到的数密度,两者截然不同,只是由于偶然的历史原因 使得它们的字母相同。 ) 就像三维空间的向量分析(例如高斯定律)那样,定义“面元 (surface element)”为单位法向 1 形式乘以表面面元的面积。这样,坐标为 xα, xβ, xγ(α, β, γ 是特定的、互不相同的指标)的三维 体积元可以表示为 ˜ ndxα dxβ dxγ, (4.9) 而单位体积元(dxα = dxβ = dxγ = 1)就是 ˜ n。 (这些 dx 是要被积分掉的无穷小量,而非梯度。 ) 通过表面的流量 回顾一下三维空间的高斯定律,它表明通过表面的流量,例如电场通量为 E · n,即电场 E 与 单位法向量的点乘。这里的情况也差不多: (粒子)通过等 ϕ 面的流量是 ⟨˜ n, ⃗ N⟩。为了证明该式, 先考虑 ϕ 是坐标之一,例如 ¯ x 的情况。等 ¯ x 面的法向 1 形式为 ˜ d¯ x,它也是单位 1 形式,因为 ˜ d¯ x − → ¯ O (0, 1, 0, 0)。则 ⟨˜ d¯ x, ⃗ N⟩ = Nα(˜ d¯ x)α = N ¯ x,由上文可见这就是通过 ¯ x 坐标面的流量。显然, 如果选择 ϕ = ¯ t,则 ⟨˜ d¯ x, ⃗ N⟩ 的结果为 N¯ 0——数密度,亦即通过等 ¯ t 面的流量。 向量的定义是把 1 形式映射为实数的函数, 上面是该定义的第一个物理实例。给定向量 ⃗ N, 可 以计算通过某个面的流量——将向量与该平面的单位法向 1 形式缩并即可。此外,这个不依赖于 坐标系的表达式 ⟨˜ d¯ x, ⃗ N⟩ 还把粒子系统的性质 ⃗ N 与表面的性质 ˜ n 分离开来。在下面的4.4节还会 讨论类似内容。 用 1 形式表示坐标系 在继续讨论流体的其它性质之前,我们应该介绍一个有用的结论。目前我们用四维速度来定义 一个惯性系,它也可以用 1 形式定义,也就是用四维速度对应的 1 形式 g(⃗ U, ),它的分量为 Uα = ηαβ Uβ, 在它所表示的坐标系中: U0 = −1, Ui = 0. 显然这个 1 形式等于 −˜ d¯ t(它们的分量相等) 。由此可见,给定一个 ˜ dt 就等效地定义了一个惯性 坐标系。相应的物理图像是:˜ dt 可以视为一组等 t 面,在同一个表面上的时刻相等。这显然定义
  54. D raft T ranslation 4.4. 还是尘埃系统:应力-能量张量 47 了一个坐标系,只是还有一些空间坐标旋转的自由度(通常可以忽略) 。实际上,˜ dt

    某种程度上比 ⃗ U 的定义更加自然。例如,四动量为 ⃗ p 的粒子在 ˜ dt 表示的坐标系中的能量为 E = ⟨˜ dt, ⃗ p⟩ = p0. (4.10) 这样不会出现方程(2.35)当中不方便的负号: E = −⃗ p · ⃗ U. 4.4 还是尘埃系统:应力-能量张量 目前我们讨论了如何描述尘埃系统的粒子数,粒子也有能量、动量,后面会看到,它们的能量 动量是 GR 中的引力场源。因此需要研究如何用具有坐标系不变性的方式描述这些量。简明起见, 假设所有尘埃粒子具有相同的静质量 m。 能量密度 在 MCRF 中, 每个粒子的能量为 m, 单位体积的粒子数为 n, 因此单位体积的能量为 mn, 将 它记作 ρ: ρ := MCRF 观测到的能量密度。 (4.11) ρ 是标量,就像 n, m 那样。对于尘埃系统: ρ = nm (尘埃系统) 。 (4.12) 对于更一般的流体, 需要考虑粒子的随机热运动动能, 即使在所有粒子的平均速度为零的坐标系内, (4.12)式也不再有效。 ¯ O 系观测到的数密度为 n/ √ 1 − v2,由于所有粒子在 ¯ O 系速度为 v,因此粒子在该系的能量 为 m/ √ 1 − v2。因此能量密度为 mn/ √ 1 − v2: ρ 1 − v2 = { 粒子在其中的速度为 v 的坐标系观测到的能量密度。 } . (4.13) 这个变换式含有两个因子 (1 − v2)−1/2 = Λ¯ 0 0 ,因为体积与能量二者都进行了变换。因此能量密度 不可能是某个向量的分量,实际上它是某个 ( 2 0 ) 张量的分量。这可以通过张量的定义看出。定义能 量需要一个 1 形式,从而得到四动量的 0 分量;定义密度也需要一个 1 形式,因为密度是通过某 个等时面的流量。于是,定义能量流量(简称为“能流”)需要两个 1 形式:1 个定义能量、1 个定义 表面。同理,定义动量密度 (momentum density) 需要两个 1 形式:1 个定义动量分量、1 个定义 密度。动量流 (momentum flux)(定义为动量(的某个分量)通过某个表面的速率)也一样需要两 个 1 形式。这些量可以统一为一个 ( 2 0 ) 张量 T,其名为应力-能量张量 (stress-energy tensor),这 个张量将两个合适的 1 形式映射为相应的值。
  55. D raft T ranslation 48 CHAPTER 4. 狭义相对论中的理想流体 应力-能量张量 应力-能量张量最方便的定义是在某个(任意)坐标系中给出它的分量:

    T(˜ dxα, ˜ dxβ) = Tαβ := { α 动量通过等 xβ 面的流量 } . (4.14) (其中 α 动量是指四动量的 α 分量:pα := ⟨˜ dxα, ⃗ p⟩。 )上式符合张量的定义,证明作为本章习 题 5。 下面来讨论这个定义是怎样符合上文内容的。 • T00 定义为 0 动量(能量)通过等时面 t = constant 的流量,也就是能量密度: T00 = 能量密度。 (4.15) • T0i 是能量通过坐标面 xi(即表面 xi = 常数)的流量: T0i = 通过 xi 坐标面的能量流。 (4.16) • Ti0 是 i 动量通过 t = constant 面的流量,也就是 i 动量密度: Ti0 = i 动量密度。 (4.17) • Tij 是 i 动量的 j 流量: Tij = 通过 xj 坐标面的 i 动量流量。 (4.18) 只要给定了 T 在任意坐标系的分量,则它在其余坐标系的分量随之确定。对于尘埃系统,T 在 MCRF 的分量非常简单,在 MCRF 中的尘埃粒子速度为零,因此所有的 i 动量为零、空间流量为 零,于是: (T00)MCRF = ρ = mn, (T0i)MCRF = (Ti0)MCRF = (Tij)MCRF = 0. 容易验证,张量 ⃗ p ⊗ ⃗ N 在 MCRF 中的分量也是如此,其中 ⃗ p = m⃗ U 是单个粒子的四速。于是 尘埃系统: T = ⃗ p ⊗ ⃗ N = mn⃗ U ⊗ ⃗ U = ρ⃗ U ⊗ ⃗ U. (4.19)
  56. D raft T ranslation 4.5. 一般流体 49 由此可得 Tαβ =

    T(˜ ωα, ˜ ωβ) = ρ⃗ U(˜ ωα)⃗ U(˜ ωβ) = ρUαUβ. (4.20) 在 ¯ O 系中: ⃗ U → ( 1 √ 1 − v2 , vx √ 1 − v2 , . . . ) , 由此可得 T¯ 0¯ 0 = ρU¯ 0U¯ 0 = ρ 1 − v2 , T¯ 0¯ i = ρU¯ 0U¯ i = ρvi 1 − v2 , T¯ i¯ 0 = ρU¯ iU¯ 0 = ρvi 1 − v2 , T¯ i¯ j = ρU¯ iU¯ j = ρvivj 1 − v2 .                        (4.21) 这与根据能量密度、能量流、动量密度、动量流的第一性原理的计算结果一致。 (前文根据第一性 原理计算了能量密度。 )注意一个重要结果:Tαβ = Tβα,也就是说,T 是对称张量。后面会发现 这个结论不止对尘埃系统,对所有系统都成立。 4.5 一般流体 目前我们处理的是最简单的粒子集合——尘埃系统,为了将结论推广到一般流体,需要考虑如 下几个性质: 1. 除了流体的整体运动以外,每个粒子都有自己的随机热运动速度; 2. 粒子之间有相互作用力,也就是流体的总能量还包括相互作用势能。 宏观量的定义 4.1节讨论了流体元的概念。对于每个流体元,存在着它在其中静止(即四动量的空间分量为 零)的坐标系,即该流体元的 MCRF。这个系是真正瞬时共动的:因为一般情况下的流体元可能 加速减速,下一时刻的 MCRF 就会是另一个坐标系,因此同一流体元在不同时刻的 MCRF 一般 不同。MCRF 相应于一个流体元,而哪个坐标系是 MCRF 则是关于位置与时间的函数。在相对论 中所有与流体元有关的标量(例如数密度、能量密度、温度)定义为它们在流体元的 MCRF 中的 取值。 表格 4.1 列出了各种宏观量的定义。我们只考虑单一组分(一种粒子)的流体,因此渗流等 等类似的物理量没有出现。 热力学第一定律 热一定律就是能量守恒的陈述。在 MCRF 中,假设流体元只通过两种方式与周围环境交换能 量:热传导(吸收的热量记作 ∆Q) 、做功(对外做功 p ∆V ,其中 V 是流体元的三维体积) 。流体
  57. D raft T ranslation 50 CHAPTER 4. 狭义相对论中的理想流体 符号 名称

    定义 ⃗ U 流体元的四速 MCRF 的四速 n 数密度 MCRF 中单位体积的粒子数 ⃗ N 流量向量 ⃗ N := n⃗ U ρ 能量密度 总质能(静质能、随机热运动动能、化学能、 …)密度 Π 单位粒子的相互作用能 Π := (ρ/n) − m ⇒ ρ = n(m + Π),因此 Π 是静质能之外能量的统称。 ρ0 静质量密度 ρ0 := mn。由于 m 是常数,因此这是只与静质量有关的“能量” ,ρ = ρ0 + nΠ. T 温度 MCRF 中通常的热力学定义(见下文) p 压强 MCRF 中通常的流体动力学定义(见下文) S 比熵 单位粒子的熵(见下文) 表 4.1: 单组分流体的宏观量 元的总能量记作 E,由于 ∆Q 是吸收的热量、p ∆V 是对外做的功,根据能量守恒: (各项都是小 量) ∆E = ∆Q − p ∆V, 移项得: ∆Q = ∆E + p ∆V.    (4.22) 如果流体元含有 N 个粒子,且粒子数不变(即粒子不会产生或消失) ,则有 V = N n , ∆V = − N n2 ∆n. (4.23) 此外,根据 ρ 的定义可得 E = ρV = ρN/n, ∆E = ρ∆V + V ∆ρ. 由以上两个结果可得 ∆Q = N n ∆ρ − N(ρ + p) ∆n n2 . 定义单位粒子吸收的热量 q := Q/N,则 n ∆q = ∆ρ − ρ + p n ∆n. (4.24) 假设上式中的变化是“无穷小的” , 可以证明, 一般情况下的流体状态由两个参数确定, 例如 ρ, T, 或 者 ρ, n。这意味着(4.24)式等号右侧 dρ − (ρ + p) dn n 只依赖于 ρ 和 n。一阶微分方程的理论表明上式总是存在积分因子:也就是说,总存在两个只与 ρ, n 有关的函数 A, B,使得 dρ − (ρ + p) dn n ≡ A dB
  58. D raft T ranslation 4.5. 一般流体 51 图 4.6: 流体元

    A 作用于相邻体元 B 的力可能沿任意方向,取决于介质与外力的性质。 对任意 ρ, n 恒成立。热力学一般把 A/n 定义为温度、把 B 定义为比熵: dρ − (ρ + p) dn n = nT dS, (4.25) 换句话说, ∆q = T ∆S. (4.26) 即,流体元的吸热量正比于它的熵的增量。 上面的 T, S 是作为方便的数学定义引入的,可以论证 T 就是通常所说的温度、S 就是热力学 第二定律中的熵,不过这里就不讨论热二定律了。熵是作为热一定律(能量守恒)的积分因子出现 的。之后要用到(4.25)和(4.26)式。 一般的应力-能量张量 Tαβ 的定义式——方程(4.14)——是非常一般性的。在 MCRF 中,流体元没有整体流动,粒 子的空间动量为零。于是在 MCRF 中: 1. T00 = 能量密度 = ρ. 2. T0i = 能量流。 尽管 MCRF 中粒子静止,但能量可以通过热传导进行传递。因此 T0i 是 MCRF 中的热传导项。 3. Ti0 = 动量密度。同样,尽管粒子在 MCRF 中静止,但能量可以通过热传导进行传递,传递 的能量会有相应的动量。下面会证明 Ti0 ≡ T0i。 4. Tij = 动量流量。这是有趣而有用的量,下一节会详细讨论它,它的名字叫应力 (stress)。 T 的空间分量 Tij 根据定义,Tij 是通过 xj 坐标面的 i 动量流量。考虑两个相邻的流体元(如图4.6) ,将它们画 为立方体形状,交界面记作 S 面。
  59. D raft T ranslation 52 CHAPTER 4. 狭义相对论中的理想流体 图 4.7:

    一个流体元。 图中画出了 A 作用于 B 的力 F(当然,B 对 A 有等大反向的反作用力) 。因为力就是动量的 变化率(由于我们在体元速度为零的 MCRF 中讨论问题,因此牛顿第二定律有效) ,所以 A 在单 位时间内以速度 F 向 B 输出动量。当然,取决于相邻体元对它的合外力,体元 B 的动量会发生 变化,显然 B 的运动是合外力作用的结果。每个力都向 B 输送动量。从 A 到 B,穿过界面 S , 有着速率为 F 的动量流量。设 S 面的面积为 A,则通过 S 面的动量流量为 F /A。如果 S 面 是等 xj 面,则流体元 A 的 Tij 等于 Fi/A。 Tij 的物理意义, 简单来说, 就是相邻流体元之间的力。 之前提过, 这些力不一定垂直于流体元 界面(例如粘性力或其它平行于界面的、为流体提供刚性的力) 。如果力垂直于界面,则除非 i = j, 否则 Tij = 0。 (想明白这个结论,后面要用) MCRF 中 Tαβ 的对称性 现在证明 T 是对称张量。为此只需要证明它在某一坐标系的分量是对称的,这意味着对任意 ˜ r, ˜ q,都有 T(˜ r, ˜ q) = T(˜ q, ˜ r),也就是说任意坐标系的分量都对称。最简单的坐标系是 MCRF。 1. Tij 的对称性。考虑图4.7,其中画出了边长为 ℓ 的立方体流体元。它对与表面 (1)(一个 x = constant 的表面)相邻的体元施加的力等于 Fi 1 = Tixℓ2,其中因子 ℓ2 是接触面的面积, 由于 F 不一定垂直于接触面,因此 i 有 1, 2, 3 三种取值。类似地,该体元通过表面 (2) 对相 邻体元施加的力等于 Fi 2 = Tiyℓ2。 (之后会取极限 ℓ → 0,因此记住流体元很小。 )该体元也 会对 −x 方向的体元施力,记作 Fi 3 。同理,Fi 4 是对 −y 方向的力。这个流体元所受的力分 别是 −Fi 1 , −Fi 2 ,等等。 第一,Fi 3 ≈ −Fi 1 ,因为体元所受的合力应该随着 ℓ → 0 而趋于零(否则 ℓ → 0 的小质点会有 无穷大的加速度) 。第二,考虑过体元中心、与 z 轴平行的转轴,计算体元关于该轴的力矩。 作用于流体上下表面的力对该力矩无贡献,它们可以忽略。−F1 对应的力矩为 −(r × F1 )z = −xFy 1 = −1 2 ℓTyxℓ2, 其中将力的作用点近似视为界面中心, r → (ℓ/2, 0, 0) (注意在那里 y = 0) 。 −F3 对应的力矩同样是 −1 2 ℓ3Tyx。−F2 的力矩是 −(r × F2 )z = +yFx 2 = 1 2 ℓTxyℓ2. 同理,
  60. D raft T ranslation 4.5. 一般流体 53 −F4 的力矩是 1

    2 ℓ3Txy。因此,总力矩为 τz = ℓ3(Txy − Tyx). (4.27) 流体元关于 z 轴的转动惯量正比于其质量乘以 ℓ2,即: I = αρℓ5, 其中 α 是某个常数,ρ 是密度(这里无论是总能量还是静质量都无所谓) 。因此角加速度为 ¨ θ = τ I = Txy − Tyx αρℓ2 . (4.28) 因为 α 是常数,ρ、Txy与Tyx 与体元的大小无关,所以在 ℓ → 0 的极限下,为了避免无穷大 的角加速度,必须 Txy = Tyx. 因此,根据流体元没有绕内部流体旋转、越小的流体并非旋转越快,我们得出结论,应力总 是对称的: Tij = Tji. (4.29) 推导过程并未涉及物质的特殊性质,因此该结论对固体、流体都适用。在狭义相对论中,牛 顿理论也能用,牛顿理论中 Tij 是三维 ( 2 0 ) 张量——应力张量的分量,材料工程师对它很熟 悉,它的名字保留作为相对论推广量 T 的一部分。 2. 动量密度等于能量流的证明。这比上一条简单多了。能量流是能量密度乘以能量流动的速率, 由于能量与质量相同,因此能量流等于质量密度乘以它流动的速率;换句话说,就是动量密 度,因此 T0i = Ti0. 能量-动量守恒 由于 T 表示流体的能量、动量,因此可以用它表示能量动量守恒定律,实际上相应的形式超 级简单。考虑图4.8中的管状体元,只考虑其横截面(图中省略了 z 轴) 。 能量可以从体元的各个表面流进流出。能量通过表面 (4) 流入体元的速率为 ℓ2T0x(x = 0); 通过表面 (2) 流入体元的速率为 −ℓ2T0x(x = a),注意其中的负号,因为 T0x 表示能量沿正 x 方向的流动,它在 (2) 处取值的方向为流出体元。同理,从 y 方向流入体元的能量为 ℓ2T0y(y = 0) − ℓ2T0y(y = ℓ)。根据能量守恒,它们之和等于流体元能量的增长率 ∂(T00ℓ3)/∂t,由此可得 ∂ ∂t (ℓ3T00) = ℓ2 [ T0x|x=0 − T0x|x=ℓ + T0y|y=0 − T0y|y=ℓ + T0z|z=0 − T0z|z=ℓ ] . (4.30)
  61. D raft T ranslation 54 CHAPTER 4. 狭义相对论中的理想流体 图 4.8:

    一个管状流体元的 z = constant 横截面。 两边除以 ℓ3 并取极限 ℓ → 0,并注意到 lim ℓ→0 T0x|x=0 − T0x|x=ℓ ℓ ≡ − ∂ ∂x T0x, (4.31) 于是(4.30)式化为: ∂ ∂t T00 = − ∂ ∂x T0x − ∂ ∂y T0y − ∂ ∂z T0z. (4.32) (4.32)式可以写为 T00 ,0 + T0x ,x + T0y ,y + T0z ,z = 0 或者 T0α ,α = 0. (4.33) 这就是能量守恒的表达式。 动量守恒的情形同理。利用相似的推导过程,可以证明 Tiα ,α = 0,因此一般的守恒定律可以 表述为 Tαβ ,β = 0. (4.34) 这对 SR 中的任何系统都成立。注意,上式就是四维散度,因而与高斯定理(守恒律的积分形 式)有关,后面会进行相关讨论。 粒子守恒 在流体流动的过程中,流体元的粒子数可能会改变,但是流体总体的粒子数不变。在图4.8中, 流体元当中粒子数的变化是由于粒子从边界面流入流出引起的,变化率等于流入或流出的净流量。
  62. D raft T ranslation 4.6. 理想流体 55 这种粒子数守恒可以通过与(4.34)式类似的方式推导出来,这里直接给出结果: ∂ ∂t

    N0 = − ∂ ∂x Nx − ∂ ∂y Ny − ∂ ∂z Nz, 或者写为 Nα ,α = (nUα),α = 0. (4.35) 我们只考虑这种服从粒子数守恒的流体。这是个很弱的限制,因为粒子数密度 n 几乎总可以 取为重子的,重子绝大部分情况下守恒。 对于不熟悉高能物理的人, “重子 (baryon)”的概念比较陌生,它是物理学中一类大质量粒子的 统称,最常见的重子是中子和质子。其它重子不稳定,在日常物理学的地位不如前两者重要,但是 它们会衰变成质子和中子,保证了重子数守恒,但不能保证静质量、特定种类的重子数。尽管理论 物理学家认为重子数可能不守恒——例如,强、弱和电磁相互作用的“大统一理论”认为质子具有有 限长的寿命,黑洞的坍缩与之后的蒸发(见11章)不满足重子数守恒——但是这些现象目前并未观 测到,而且在大部分情况下都不重要。 4.6 理想流体 最后来讨论一下最常用的流体模型。相对论中的理想流体 (perfect fluid) 是在流体元的 MCRF 中没有粘性、没有热传导的流体。 它是热力学“理想气体”概念的推广,理想流体只比“尘 埃系统”复杂,是实际应用的最简单的流体模型。理想流体的两个限制条件大大简化了它的应力-能 量张量,下面就来研究。 没有热传导 根据 T 的定义,没有热传导意味着在 MCRF 中,T0i = Ti0 = 0,只有粒子流动时能量才会 流动。回顾一下,在讨论热力学第一定律的时候,我们证明了如果粒子数守恒,则比熵与热流的关 系为(4.26)式。这意味着在理想流体中,如果满足粒子数守恒(4.35)式,则流体的熵 S 不随时间变 化。后面会详细讨论这一守恒律。 没有粘性 粘性力是平行于流体元界面的力,没有粘性意味着相互作用力总是垂直于界面,即 Tij 只有在 i = j 时才不为零,在 i ̸= j 时 Tij = 0,也就是说 Tij 是对角矩阵。此外,Tij 必须在所有 MCRF 都是对角的,因为“没有粘性”的条件不依赖于空间坐标轴方向。唯一的在所有坐标系都是对角的矩 阵是单位矩阵的常数倍:所有对角元都相等。因此,通过 x 表面的只有 x 方向的力,y, z 同理。各 平面的单位面积的力相等,称之为压强 (pressure),记作 p。因此 Tij = pδij。对称的 3 × 3 矩阵 Tij 有 6 个独立变量,无粘性条件使得只余下一个变量——压强。
  63. D raft T ranslation 56 CHAPTER 4. 狭义相对论中的理想流体 T 的形式

    根据上文的论述,在 MCRF 中,T 的分量为: (Tαβ) =         ρ 0 0 0 0 p 0 0 0 0 p 0 0 0 0 p         . (4.36) 不难证明,在 MCRF 中: Tαβ = (ρ + p)UαUβ + pηαβ. (4.37) 例如,如果 α = β = 0,则 U0 = 1, η00 = −1, Tαβ = (ρ + p) − p = ρ,正如(4.36)所示。验证所有 α, β 的取值可以证明(4.37)可以导出(4.36)。方程(4.37)的坐标系无关的形式为: T = (ρ + p)⃗ U ⊗ ⃗ U + ρg−1. (4.38) 这就是理想流体的应力-能量张量。 压强的含义 比较(4.38)和(4.19)可以看出, “尘埃”是无压强的理想流体。这意味着只有理想流体的粒子没有 随机运动,它的压强才为零。压强来自粒子的随机速度。即使是粒子之间可以视为无碰撞的稀薄气 体仍然有压强,这是因为压强是动量流量,不论它来自于作用力或者粒子通过界面都可以。 守恒律 根据(4.34)式可得 Tαβ ,β = [ (ρ + p)UαUβ + pηαβ ] ,β = 0. (4.39) 这是张量微积分的第一个计算实例。上式代表 4 个方程,对应 α 的 4 个取值。首先,假设粒子数 守恒: (nUβ),β = 0, (4.40) 将(4.39)式等号右侧第一项写为 [ (ρ + p)UαUβ ] ,β = [ ρ + p n UαnUβ ] ,β = nUβ ( ρ + p n Uα ) ,β . (4.41)
  64. D raft T ranslation 4.6. 理想流体 57 由于 ηαβ 矩阵元都是常数,因此

    ηαβ ,γ = 0。这可以导出: Uα ,β Uα = 0. (4.42) 上式的证明为, UαUα = −1 ⇒ (UαUα ),β = 0, (4.43) 或者 (UαUγηαγ ),β = (UαUγ),β ηαγ = 2Uα ,β Uγηαγ . (4.44) 最后一步利用了 ηαβ 的对称性,即 Uα ,β Uγηαγ = UαUγ ,β ηαγ 。最后,(4.44)式的最后一个表达式 可以化为 2Uα ,β Uα . 根据方程(4.43)可知上式为零,这就证明了(4.42)式。 (4.42)式的作用如下。将(4.41)带入原方程(4.39): nUβ ( ρ + p n Uα ) ,β + p,β ηαβ = 0. (4.45) 根据上式表示的四个方程,可以导出一个特别有用的出来。上式两侧乘以 Uα 并对 α 求和,这给出 了(4.45)式在 MCRF 的时间分量: nUβUα ( ρ + p n Uα ) ,β + p,β ηαβUα = 0. (4.46) 上式最后一项等于 p,β Uβ 它就是压强 p 沿着流体元世界线的导数 dp/dτ. 根据(4.42)式,Uα 对 β 求导数的项等于零,因此 Uβ [ −n ( ρ + p n ) ,β + p,β ] = 0, (4.47) (其中利用了 UαUα = −1) 上式可以化为 −Uβ [ ρ,β − ρ + p n n,β ] = 0. (4.48)
  65. D raft T ranslation 58 CHAPTER 4. 狭义相对论中的理想流体 用另一种形式写为 dρ

    dτ − ρ + p n dn dτ = 0. (4.49) 将它与(4.25)比较可得 UαS,α = dS dτ = 0. (4.50) 因此,粒子数守恒的理想流体流动过程中的比熵守恒,这称为绝热的 (adiabatic)。由于流体 元的熵在流动过程中不变,因此一般不需要考虑它。然而需要记住,热力学的能量守恒定律体现在 守恒方程(4.39)当中,parallel to Uα。1 方程(4.39)的其余三个空间分量按如下方式处理。将(4.45)式写为 nUβ ( ρ + p n Uα ) ,β + p,β ηαβ = 0, 在 MCRF 中,Ui = 0,但是 Ui ,β ̸= 0。在 MCRF 中,上式与 Uα 缩并的结果就是的取上式的零 分量,前面已经计算过了。因此现在只需要考虑 i 分量: nUβ ( ρ + p n Ui ) ,β + p,β ηiβ = 0. (4.51) 因为 Ui = 0,而 (ρ + p)/n 的 β 导数没有贡献,因此 (ρ + p)Ui ,β Uβ = p,β ηiβ = 0. (4.52) 为了更容易理解,将 i 指标降低,因为 η β i = δ β i ,因此 (ρ + p)Ui,β Uβ + p,i = 0. (4.53) 最后,注意到 Ui,β Uβ 是四维加速度 ai 的定义: (ρ + p)ai + p,i = 0. (4.54) 熟悉非相对论性流体力学的读者会发现上式就是流体的欧拉方程: ρa + ∇p = 0, (4.55) 1最后一句没看懂(捂脸
  66. D raft T ranslation 4.7. 对于广义相对论的重要性 59 的推广。其中 a =

    ˙ v + (v · ∇)v. (4.56) 唯一的不同是 ρ 在相对论推广的形式为 (ρ + p)。在相对论中,(ρ + p) 起到了“惯性质量密度”的作 用,根据方程(4.54),(ρ + p) 越大,物体加速越困难。(4.54)是本质上与 F = ma 相似,−p,i 是流 体元单位体积所受的力。粗略地说,p 是流体元对它附近体元施加的力,故而 −p 是流体元所受的 力。但是相反一侧的体元也会给它施加反向的力,因此如果 p 随着位置的不同而变化,就会造成使 流体元加速的净作用力,这就是 −∇p 作为力出现的原因。 4.7 对于广义相对论的重要性 广义相对论是引力的相对论性理论。如果没有很好地理解张量、SR 中的流体力学,以及弯曲 空间,就不能理解广义相对论。目前还没有学习曲率(下一步就要讲) ,不过现在可以向前展望,认 识一下这个理论的大致轮廓。 首先是 T 在 GR 中超级重要的地位。牛顿理论的引力场源是质量密度 ρ,它与我们的 ρ0 很 像。但是从相对论的观点看,只把静质量作为引力场源是很奇怪的,因为静质量与能量可以相互转 化。实际上,一些高精度实验与这种理论不符(后面会讲) 。因此引力场源应该是所有能量——总 质能密度 T00。但是如果引力场源只是张量的一个分量,那么不可能得到具有不变性的引力理论: 因为总要选择一个坐标系来计算 T00。因此爱因斯坦猜测,引力场源是 T:所有应力、压强与动量 都是引力场源。这个猜想,结合弯曲空间的深刻认识,使他建立了广义相对论。 第二, 压强在 GR 中的地位比在牛顿理论中更加基本。其一, 因为压强是一种引力场源;其二, 压强出现在了(4.54)式当中。考虑一个高密度恒星,它的强引力场要求具有很大的压强梯度,梯度 的大小与如果压强消失则流体元具有的加速度 ai 有关。给定引力场,也就确定了 ai ,相应的压强 梯度抵消了引力造成的加速度: −ai = p,i ρ + p . 这就得到了压强梯度 pi 。因为 (ρ + p) 比 ρ 大,因此相对论计算得到的压强梯度比牛顿理论大。此 外,由于 T 的所有分量都是引力场源,压强更大引力场也更强,这就使得维持恒星所需的压强(比 牛顿理论的计算结果)更大。对于 p ≪ ρ 的恒星(见下文) ,相对论与牛顿理论的差别不大。但如 果 p 与 ρ 差不多,则压强的增加使得压强梯度不可能维持恒星,必然会发生引力坍缩。当然,上 述内容含有大量计算过程,但从中可以看到即使研究 SR 中的流体也能看出 GR 对引力的一些根 本变化。 现在考虑一下 p 和 ρ 的相对大小。从第一章习题 1 可见,一般情况下 p ≪ ρ。实际上,只有 对密度很大的物质(例如中子星)或者温度很高、粒子热运动速度接近光速(“相对论性”气体)才 有 p ≈ ρ。 4.8 高斯定律 关于流体的最后一个内容是积分形式的守恒律, 它的微分形式是(4.34)和(4.35)式。就像三维向 量分析那样,SR 也有同样的高斯定律:散度的体积分可以化为面积分。定理的证明与三维情形类
  67. D raft T ranslation 60 CHAPTER 4. 狭义相对论中的理想流体 图 4.9:

    一块时空区域的边界 似,这里就不证了,只给出它的形式: ∫ V α ,α d4x = V αnα d3S, (4.57) 其中 ˜ n 是4.3节介绍的单位法向 1 形式,d3S 表示四维体积分区域的三维超表面的三维面元。 与三维情形相同,法向 1 形式指向区域外部。 为了说明(4.57)式,图4.9画出了一块简单的四维区域,该积分区域的表面由四对超平面组成, 分别是等 t, x, y, z 面,图中只画出了两对(因为是二次元平面图) 。t2 平面的法向 1 形式是 ˜ dt,而 t1 平面的法向 1 形式是 −˜ dt,因为 t1 面“指向区域外”的方向是 −t 方向。x2 面的法向是 ˜ dx,x1 的是 −˜ dx。因此(4.57)式的面积分等于 ∫ t2 V 0 dxdydz + ∫ t1 (−V 0) dxdydz + ∫ x2 V x dtdydz + ∫ x1 (−V x) dtdydz +其它边界面的类似的项。 上式整理为 ∫ [ V 0(t2 ) − V 0(t1 ) ] dxdydz + ∫ [ V x(x2 ) − V x(x1 ) ] dtdydz + . . . . (4.58) 如果 ⃗ V 取为 ⃗ N,则 Nα ,α = 0 意味着上式为零,也就是说三维体元中的粒子数变化(第一个积 分)是由穿过边界面的流量引起的(后面几项) 。如果要讨论能量守恒,就把 Nα 换成 T0α 并利用 T0α ,α = 0,并且可以得出与(4.58)式相似的解释。高斯定律是能量守恒的积分表述。
  68. D raft T ranslation 4.9. 扩展阅读 61 4.9 扩展阅读 连续介质力学与守恒律在大部分

    GR 教材都有所讲述,例如 Misner et al. (1973)。需要补习 热力学或流体力学的读者可以分别参考 Fermi (1956) and Landau and Lifshitz (1959)。除了本章 习题 25 之外,我们没有讨论电磁学,但电磁场也有应力-能量张量以及相应的守恒律,见 Landau and Lifshitz (1962) or Jackson (1975)。考虑耗散的相对论流体有着内禀的复杂性,尚有待进一步 研究,这方面可见 Israel and Stewart (1980)。连续介质的另一种模型是无碰撞气体,Andréasson (2005) 介绍了如何在 GR 中描述这种系统。 4.10 习题
  69. D raft T ranslation Chapter 5 曲率的序言 1 (5.1) 2

    (5.2) 5.1 引力与曲率的关系 前面都是在狭义相对论 (SR) 中讨论问题。力在 SR 当中的地位很重要,但是前面从来没有直 接研究引力。SR 的一个重要基础是存在覆盖整个时空的惯性系:全体时空可以由一个坐标系描述, 这个系的所有坐标点总是相对于原点静止,所有的坐标钟与原点的钟走时率相同。从这个基本假设 可以导出时间间隔 ∆s2 的概念,它给物理事件赋予了具有不变性的几何意义。例如,两事件之间 的类时间隔是经过这两个时件的钟所走过的时间;类空间隔是在这两个事件同时的坐标系当中的 空间距离。 度规是计算间隔的数学函数,因此 SR 的度规是由杆的长度和钟的走时定义的。This is the power of SR and one reason for the elegance and compactness of tensor notation in it (例如用 ⃗ N 统一表示了“数密度”和“流量”) 。 (未完成) 5.2 极坐标系的张量代数 考虑欧几里得平面。直角坐标 {x, y},极坐标 {r, θ} 之间的关系为: r = (x2 + y2)1/2, x = r cos θ, θ = arctan(y/x), y = r sin θ.    (5.3) 由直角坐标的微小增量 ∆x, ∆y 造成的 ∆r, ∆θ 为 ∆r = x r ∆x + y r ∆y = cos θ∆x + sin θ∆y, ∆θ = − y r2 ∆x + x r2 ∆y = − 1 r sin θ∆x + 1 r cos θ∆y,      (5.4) 63
  70. D raft T ranslation 64 CHAPTER 5. 曲率的序言 上式到一阶小量都成立。 也可以使用其它坐标系。记一般的坐标系为

    {ξ, η}: ξ = ξ(x, y), ∆ξ = ∂ξ ∂x ∆x + ∂ξ ∂y ∆y, η = η(x, y), ∆η = ∂η ∂x ∆x + ∂η ∂y ∆y.        (5.5) 为了保证 (ξ, η) 是个好坐标系,任意两个不同的点 (x1 , y1 ) 和 (x2 , y2 ) 应该对应不同的 (ξ1 , η1 ) 与 (ξ2 , η2 )(通过(5.5)式对应) 。例如,按 ξ = x, η = 1 定义的坐标系不是好坐标系,因为不同的两 点 (x = 1, y = 2) 和 (x = 1, y = 3) 都对应 (ξ = 1, η = 1)。数学上,这要求如果方程(5.5)中的 ∆ξ = ∆η = 0,则必须对应相同的点,即 ∆x = ∆y = 0. 这意味着(5.5)式的行列式非零: det   ∂ξ/∂x ∂ξ/∂y ∂η/∂x ∂η/∂y   ̸= 0. (5.6) 这个行列式称为坐标系变换(5.5)式的 Jacobian(雅可比行列式) 。如果 Jacobian 在某一点为零,则 称坐标变换在该点具有奇性 (singular)。 向量与 1 形式 向量的旧的定义是在任意坐标变换下与位移的变换方式相同的量。也就是说,向量 ∆⃗ r 可以 表示为1位移 (∆x, ∆y),或者在极坐标系表示为 (∆r, ∆θ),或者在一般坐标系中为 (∆ξ, ∆η). 根 据(5.5)式,对于微小的 (∆x, ∆y) 有:   ∆ξ ∆η   =   ∂ξ/∂x ∂ξ/∂y ∂η/∂x ∂η/∂y     ∆x ∆y   . (5.7) 定义变换矩阵 (Λα′ β ) =   ∂ξ/∂x ∂ξ/∂y ∂η/∂x ∂η/∂y   , (5.8) 则可以将任意向量 ⃗ V 的分量的变换规律写成与 SR 相同的形式: V α′ = Λα′ β V β, (5.9) 其中不带撇的指标代表 (x, y),带撇指标表示 (ξ, η),指标取 1, 2. 向量可以定义为分量按照(5.9)式 变换的这样的量。不过,存在一种更加复杂而自然的、现代的定义方式,下面进行介绍。 考虑平面上的标量场 ϕ。给定坐标系 (ξ, η) 就能计算偏导数 ∂ϕ/∂ξ 和 ∂ϕ/∂η. 定义 1 形式 ˜ dϕ 为(在坐标系 (ξ, η) 中)具有如下分量的几何对象: ˜ dϕ → (∂ϕ/∂ξ, ∂ϕ/∂η). (5.10) 这是 1 形式的一般定义,每个标量场都定义了一个 1 形式。1 形式分量的变换规律可以通过链式 1欧几里得空间的向量用箭头标记,其分量指标 (1, 2) 用希腊字母表示,求和对所有指标进行。
  71. D raft T ranslation 5.2. 极坐标系的张量代数 65 法则 (chain rule)

    导出: ∂ϕ ∂ξ = ∂x ∂ξ ∂ϕ ∂x + ∂y ∂ξ ∂ϕ ∂y , (5.11) ∂ϕ/∂η 同理。用行向量可以方便地用矩阵形式表示: ( ∂ϕ/∂ξ ∂ϕ/∂η ) = ( ∂ϕ/∂x ∂ϕ/∂y )   ∂x/∂ξ ∂x/∂η ∂y/∂ξ ∂y/∂η   , (5.12) 1 形式的变换矩阵可类比(5.8)式定义为一组 (x, y) 坐标关于 (ξ, η) 坐标的偏导数: (Λα β′ ) =   ∂x/∂ξ ∂x/∂η ∂y/∂ξ ∂y/∂η   (5.13) 这样,(5.12)式就可以写成分量求和的形式: (˜ dϕ)β′ = Λα β′ (˜ dϕ)α . (5.14) 注意,上式的求和是对变换矩阵的第一个分量进行的,这对应于行向量左乘矩阵。 值得一提的是,SR 从来没考虑过行向量,因为 Lorentz 变换矩阵是个简单的对称矩阵。不过 即使是上面的简单情况也要用到行向量。当张量的指标多于两个时,矩阵表示就非常累赘。GR 需 要处理四个甚至五个指标的张量,因此后面一般用代数形式(如(5.14)式)表示变换,后面就不再 使用矩阵表示了。 本节已经看到,在现代观点之下,张量代数的基础是 1 形式的定义。它比旧定义更加自然,旧 定义首先定义了单个向量 (∆x, ∆y),其它向量类比它定义。而现代定义利用偏导数定义了一类 1 形式,1 形式分量的变换规律自然地随之导出。 向量定义为将 1 形式映射为实数的线性函数。这个定义的具体含义在下一小节讲述。先来说 明与 SR 形式的相似性,向量的变换规律为 (5.9) 式,有趣的是变换矩阵 (Λα′ β ) 和 (Λα β′ ) 互逆。 它们相乘得到:   ∂ξ/∂x ∂ξ/∂y ∂η/∂x ∂η/∂y     ∂x/∂ξ ∂x/∂η ∂y/∂ξ ∂y/∂η   =    ∂ξ ∂x ∂x ∂ξ + ∂ξ ∂y ∂y ∂ξ ∂ξ ∂x ∂x ∂η + ∂ξ ∂y ∂y ∂η ∂η ∂x ∂x ∂ξ + ∂η ∂y ∂y ∂ξ ∂η ∂x ∂x ∂η + ∂η ∂y ∂y ∂η    . (5.15) 利用链式法则与偏导数的定义可以算出结果为   ∂ξ/∂ξ ∂ξ/∂η ∂η/∂ξ ∂η/∂η   =   1 0 0 1   ￿ (5.16) 曲线与向量 通常所说的曲线是平面上一系列连续的点,我们把它称作路径 (path),而把曲线专指参数化的 路径。这也是现代数学的做法,将曲线 (curve) 定义为从实数区间到平面路径的映射。这意味着曲
  72. D raft T ranslation 66 CHAPTER 5. 曲率的序言 线是每一点都对应一个实数的路径,实数称为参数 (parameter),记作

    s。每一点的坐标表示为参 数 s 的函数就定义了平面上的一条曲线: 曲线:{ξ = f(s), η = g(s), a ≤ s ≤ b} (5.17) 将参数改变为 s′ = s′(s)(新参数是旧参数的函数,点不变) ,则有 曲线:{ξ = f′(s′), η = g′(s′), a′ ≤ s′ ≤ b′}, (5.18) 其中 f′, g′ 是新的函数,而 a′ = s′(a), b′ = s′(b). 上式在数学上是一条新的曲线,尽管它的像 (image)(所经过的平面上的点)与原来相同。因此同一路径对应无数条曲线。 标量场 ϕ 沿曲线的导数是 dϕ/ds,依赖于 s,因此变换参数,导数也随之变换。可以将导数写 为 dϕ ds = ⟨˜ dϕ, ⃗ V ⟩, (5.19) 其中 ⃗ V 是分量为 (dξ/ds, dη/ds) 的向量,这个向量只与曲线有关,而 ˜ dϕ 只依赖于 ϕ. 因此 ⃗ V 是 与曲线特征有关的向量,称之为切向量 (tangent vector)。 (见图5.1,显然它与曲线相切) 画外音: 哪里显然了…… 所以,向量可以看作是给定 ϕ 而产生 dϕ/ds 的东西。这就引出了最现代的观点,曲线的切 向量应该称为 d/ds。有些相对论文献偶尔使用这一符号。不过我们把它记作 ⃗ V ,知道它的分量是 (dξ/ds, dη/ds) 就好了。注意,平面上的一条路径上的任一点都有着无数切向量,它们的方向相同 而长度不同,它们可以视为不同曲线(在一点邻域中的参数化不同)的切向量。曲线是给定了参数 的路径,因此曲线的切向量唯一。此外,即使两条曲线在某一点的切向量相等,它们在其它点也可 以不同,根据 Taylor 展开式 ξ(s + 1) ≈ ξ(s) + dξ/ds 可见,⃗ V (s) 近似沿曲线从 s 到 s + 1 延展。 图 5.1: 一条曲线,曲线的参数,以及曲线的切向量 注意 s 在坐标变换下不变(它的定义和坐标系无关) ,而 ⃗ V 的分量变化,因此根据链式法则可 得   dξ/ds dη/ds   =   ∂ξ/∂x ∂ξ/∂y ∂η/∂x ∂η/∂y     dx/ds dy/ds   . (5.20) 这与前面的向量变换律(5.7)式相同。 总结一下现代观点,向量是与某条曲线相切、将 ˜ dϕ 映射为 dϕ/ds 的线性函数。这样,下面就 能更进一步地研究极坐标系。
  73. D raft T ranslation 5.2. 极坐标系的张量代数 67 极坐标系的 1 形式基与向量基

    显然,坐标基向量的变换规律为: ⃗ eα′ = Λβ α′ ⃗ eβ , 在极坐标下: ⃗ er = Λx r ⃗ ex + Λy r ⃗ ey (5.21) = ∂x ∂r ⃗ ex + ∂y ∂r ⃗ ey = cos θ⃗ ex + sin θ⃗ ey , (5.22) 类似有 ⃗ eθ = ∂x ∂θ ⃗ ex + ∂y ∂θ ⃗ ey = −r sin θ⃗ ex + r cos θ⃗ ey , (5.23) 注意,上式已经利用了 Λx r = ∂x ∂r . (5.24) 类似地, “反向”变换的矩阵元为 Λr x = ∂r ∂x . (5.25) 这个变换矩阵十分简单:矩阵指标的上下顺序对应到求导的上下关系就好了。 1 形式基的关系可类似求出: ˜ dθ = ∂θ ∂x ˜ dx + ∂θ ∂y ˜ dy, = − 1 r sin θ˜ dx + 1 r cos θ˜ dy. (5.26) (注意上式与普通的微积分运算(5.4)式相似) 。同样可得 ˜ dr = cos θ˜ dx + sin θ˜ dy. (5.27) 根据以上内容可以画出不同点的基(图5.2) 。容易画出基向量,1 形式基可以画出 ˜ dr 和 ˜ dθ 的等 r、 等 θ 面辅助进行,不同位置的面的指向不同。
  74. D raft T ranslation 68 CHAPTER 5. 曲率的序言 图 5.2:

    极坐标系的向量基与 1 形式基图示 上面体现了一个非常重要的事实:各点的基互不相同。例如,图5.2中 A 点与 C 点的向量基不 平行。这是由于基向量指向坐标增加的方向,而这个方向随着点的改变而改变。此外,基的长度也 不是恒定不变的。例如,根据(5.23)式可得 |⃗ eθ |2 = ⃗ eθ · ⃗ eθ = r2 sin2 θ + r2 cos2 θ = r2, (5.28a) |⃗ er | = 1, |˜ dr| = 1, |˜ dθ| = r−1. (5.28b) 距离原点越远,⃗ eθ 的模长越大。因为 ⃗ eθ 在 (r, θ) 系的分量为 (0, 1),意味着它表示 θ 分量的 1 单 位的位移,即 1 弧度。在半径更大的地方,移动 1 弧度的长度更大。因此极坐标基并非单位基。其 它基的模长容易求出。可以发现,|˜ dθ| 在 r = 0 附近更大(更紧密) ,因为一个给定的向量在原点 附近覆盖的 θ 范围更大。 度规张量 上面的点乘结果都是根据直角坐标系 x, y 中已知的度规来计算的: ⃗ ex · ⃗ ex = ⃗ ey · ⃗ ey = 1, ⃗ ex · ⃗ ey = 0; 或者用张量记号写为 g(⃗ eα ,⃗ eβ ) = δαβ 在直角坐标系中。 (5.29) g 在极坐标系的分量是什么?根据分量的定义: gα′β′ = g(⃗ eα′ ,⃗ eβ′ ) = ⃗ eα′ · ⃗ eβ′ , (5.30) 或者根据(??)、(5.22)和(5.23)式可得 grr = 1, gθθ = r2, grθ = 0. (5.31) 由此可得 g 在极坐标系的分量为 (gαβ )polar =   1 0 0 r2   , (5.32)
  75. D raft T ranslation 5.3. 极坐标系的张量微积分 69 线元 (line element)

    可以方便地同时表示 g 的分量以及坐标,线元即为任意“无穷小”位移 d⃗ ℓ 的模: d⃗ ℓ · d⃗ ℓ = ds2 = |dr⃗ er + dθ⃗ eθ |2 = dr2 + r2dθ2. (5.33) 不要将这里的 dr, dθ 与 1 形式基 ˜ dr, ˜ dθ 混淆,前者是 d⃗ ℓ 在极坐标系的分量, “d”就是“无穷小 ∆”的意思。 另外有一种导出(5.33)式的方法值得一提。回顾(3.26)式,它表明任何 ( 0 2 ) 张量可以表示为 ( 0 2 ) 张量基 ˜ dxα ⊗ ˜ dxβ 的线性组合: g = gαβ ˜ dxα ⊗ ˜ dxβ = ˜ dr ⊗ ˜ dr + r2˜ dθ ⊗ ˜ dθ. 尽管上式看起来像(5.33)式, 但它们不一样:上式各项是算符, 作用于向量 d⃗ ℓ (其分量为 dr, dθ) 之 后得到(5.33)式。由于相应学科的符号混乱,导致上面两个式子非常不幸地十分相像。大多数教材 与论文仍采用“旧式的”表达式——方程(5.33)来表示度规分量,本书遵从这一习惯。 度规分量矩阵存在逆矩阵:   1 0 0 r2   −1 =   1 0 0 r−2   . (5.34) 由此可得 grr = 1, grθ = 0, gθθ = 1/r2。这可以建立 1 形式与向量之间的映射。例如,向量场 ϕ 的 梯度场为 ˜ dϕ,则这个 1 形式相应的向量 dϕ 具有分量 (⃗ dϕ)α = gαβϕ,β (5.35) 或者写为 (⃗ dϕ)r = grβϕ,β = grrϕ,r + grθϕ,θ = ∂ϕ ∂r . (5.36a) (⃗ dϕ)θ = gθrϕ,r + gθθϕ,θ = 1 r2 ∂ϕ ∂θ . (5.36b) 可见,1 形式的分量是 (ϕ,r , ϕ,θ ),而相应向量的分量是 (ϕ,r , ϕ,θ /r2)。就算是在欧几里得空间,向 量与相应的 1 形式的分量一般也不相同。直角坐标系是它们在其中唯一相等的坐标系。 5.3 极坐标系的张量微积分 极坐标系的基向量并非处处相等,这对向量求导产生了麻烦。例如,简单的直角坐标基 ⃗ ex ,它 在各点都相等,⃗ ex 在极坐标系中的分量为 ⃗ ex → (Λr x , Λθ x ) = (cos θ, −r−1 sin θ)。尽管 ⃗ ex 处处相
  76. D raft T ranslation 70 CHAPTER 5. 曲率的序言 同,但显然它的分量不是常数,这是由于分量对应的基向量在各点不同。如果只把分量对坐标,例 如对

    θ 求导,结果显然并非 ∂⃗ ex /∂θ,因为后者必须等于零。 从这个例子可见,对向量分量的求导结果一般情况下不是向量的导数,必须要考虑到基向量的 变化。这是理解曲线坐标系与弯曲空间的关键。下面来系统讨论这些内容。 基向量的导数 由于 ⃗ ex 和 ⃗ ey 是常向量场(在各点的值相同) : ∂ ∂r ⃗ er = ∂ ∂r (cos θ⃗ ex + sin θ⃗ ey ) = 0, (5.37a) ∂ ∂θ ⃗ er = ∂ ∂θ (cos θ⃗ ex + sin θ⃗ ey ) = − sin θ⃗ ex + cos θ⃗ ey = 1 r ⃗ eθ . (5.37b) 这个结果有着简单的图像,如图5.3。在相近的两点 A, B,它们的 ⃗ er 的指向是从原点向外的径向, 而有微小的差别。⃗ er 对 θ 的导数就是 A, B 点的 ⃗ er 之差除以 ∆θ。从图中可见,这个差平行于 ⃗ eθ , 这与方程(5.37b)相符。 图 5.3: θ 变化 ∆θ 造成的 ⃗ er 的变化。 同理可得 ∂ ∂r ⃗ eθ = ∂ ∂r (−r sin θ⃗ ex + r cos θ⃗ ey ) = 0, = − sin θ⃗ ex + cos θ⃗ ey = 1 r ⃗ eθ , (5.38a) ∂ ∂θ ⃗ eθ = −r cos θ⃗ ex − r sin θ⃗ ey = −r⃗ er . (5.38b) 米娜桑可以画类似5.3那样的图来解释这些求导结果。
  77. D raft T ranslation 5.3. 极坐标系的张量微积分 71 一般向量的导数 回到 ⃗

    ex 的导数,既然 ⃗ ex = cos θ⃗ er − 1 r sin θ⃗ eθ , (5.39) 则有 ∂ ∂θ ⃗ ex = ∂ ∂θ (cos θ)⃗ er + cos θ ∂ ∂θ (⃗ er ) − ∂ ∂θ ( 1 r sin θ ) ⃗ eθ − 1 r sin θ ∂ ∂θ (⃗ eθ ) (5.40) = − sin θ⃗ er + cos θ ( 1 r ⃗ eθ ) − 1 r cos θ⃗ eθ − 1 r sin θ(−r⃗ er ). (5.41) 其中利用了(5.37), (5.38)式。化简上式可得 ∂ ∂θ ⃗ ex = 0, (5.42) 正如所料。(5.40)式中的第一、三项是 ⃗ ex 的极坐标系分量的求导结果,另外两项是对极坐标系基向 量的求导结果,它们彼此相消结果为零。 一般的向量 ⃗ V 在极坐标系的分量 (V r, V θ),向量的导数,类比(5.40)式,等于: ∂⃗ V ∂r = ∂ ∂r (V r⃗ er + V θ⃗ eθ ) = ∂V r ∂r ⃗ er + V r ∂⃗ er ∂r + ∂V θ ∂r ⃗ eθ + V θ ∂⃗ eθ ∂r , ∂⃗ V /∂θ 类似。上式用指标记号写为 ∂⃗ V ∂r = ∂ ∂r (V α⃗ eα ) = ∂V α ∂r ⃗ eα + V α ∂⃗ eα ∂r . 其中指标 α 跑遍 r, θ。 由此可见,⃗ V 的导数不仅包括其分量 V α 的导数。r 是坐标之一,上式对 r 的导数可以推广为 对一般坐标的导数: ∂⃗ V ∂xβ = ∂V α ∂xβ ⃗ eα + V α ∂⃗ eα ∂xβ , (5.43) 其中 xβ, β = 1, 2 分别对应 r, θ。 Christoffel 符号 方程(5.43)的最后一项显然十分重要。由于 ∂⃗ eα /∂xβ 本身是个向量,它也可以表示为基向量的 线性组合;线性组合的系数记作 Γµ αβ : ∂⃗ eα ∂xβ = Γµ αβ ⃗ eµ . (5.44)
  78. D raft T ranslation 72 CHAPTER 5. 曲率的序言 Γµ αβ

    的含义是向量 ∂⃗ eα /∂xβ 的 µ 分量。它有三个分量:一个分量(α)表明对哪个基向量求导; 第二个(β)表明基向量对哪个坐标求导;第三个(µ)表示求导结果向量的分量。Γµ αβ 十分有用, 值得给它进行命名:称之为 Christoffel 符号。Christoffel 符号是不是张量的分量?这个问题之后 讨论。 前面实际上已经算出了极坐标系的 Christoffel,从方程(5.37)和(5.38)可得 (1) ∂⃗ er ∂r = 0 ⇒ Γµ rr = 0, ∀ µ, (2) ∂⃗ er ∂θ = 1 r ⃗ eθ ⇒ Γr rθ = 0, Γθ rθ = 1 r , (3) ∂⃗ eθ ∂r = 1 r ⃗ eθ ⇒ Γr θr = 0, Γθ θr = 1 r , (4) ∂⃗ eθ ∂θ = −r⃗ er ⇒ Γr θθ = −r, Γθ θθ = 0.                        (5.45) 定义式(5.44)当中的所有指标都必须在同一个坐标系中。因此,尽管我们利用了 ⃗ ex ,⃗ ey 是常向量场 的性质导出了 ⃗ er ,⃗ eθ 的导数,但是(5.45)中的各方程并不依赖直角坐标系。Christoffel 符号的重要 性在于,它可以将极坐标系基向量的导数只用极坐标系的量表示,而与其它坐标系无关。 协变导数 利用 Christoffel 符号的定义(5.44)式,可以将(5.43)式的导数表示为 ∂⃗ V ∂xβ = ∂V α ∂xβ ⃗ eα + V αΓµ αβ ⃗ eµ . (5.46) 最后一项表示了对傀儡指标 α, µ 的两个求和,对这两个傀儡指标重新命名:µ 换成 α,α 换成 µ 得到 ∂⃗ V ∂xβ = ∂V α ∂xβ ⃗ eα + V µΓα µβ ⃗ eα . (5.47) 这样重命名了傀标之后上式就可提出等号右侧的 ⃗ eα 项: ∂⃗ V ∂xβ = ( ∂V α ∂xβ + V µΓα µβ ) ⃗ eα . (5.48) 因此,向量场 ∂⃗ V /∂xβ 的分量为 ∂V α ∂xβ + V µΓα µβ . (5.49) 回顾一下偏导数的简写记号:∂V α/∂xβ = V α ,β ,利用这个记号并定义一个新记号: V α ;β := V α ,β + V µΓα µβ . (5.50) 在这个分号简写记号下:
  79. D raft T ranslation 5.3. 极坐标系的张量微积分 73 ∂⃗ V ∂xβ

    = V α ;β ⃗ eα (5.51) 它将(5.48)式表示成了非常紧凑的形式。 若将 β 视为固定不动的, 则 ∂⃗ V /∂xβ 是个向量场。 但是实际上 β 可以有两种取值, 所以 ∂⃗ V /∂xβ 可以视为将向量 ⃗ eβ 映为向量 ∂⃗ V /∂xβ 的 ( 1 1 ) 张量场,就像第3章习题 17 那样。这个张量场称为 ⃗ V 的协变导数 (covariant derivative), (很自然地)记作 ∇⃗ V ,它的分量为 (∇⃗ V )α β = (∇β ⃗ V )α = V α ;β (5.52) 在直角坐标系中,这些分量就等于 V α ,β 。然而在曲线坐标系中,必须考虑基向量的导数,我们得 到了 V α ;β 是 ∇⃗ V 的分量,不论在哪个曲线坐标系,只要把那个系的 Christoffel 符号带入(5.50)式 就能算出。上述内容的重要性不可低估,它是之后所有内容的基础。存在一个叫做 ∇⃗ V 的 ( 1 1 ) 张 量,它在直角坐标系中的分量是 ∂V α/∂xβ,在一般的坐标系 {xµ′ } 中的分量是 V α′ ;β′ ,这个分量 可以通过两种方式计算: • 直接在 {xµ′ } 坐标系中利用(5.50)式和那个系的 Christoffel 符号 Γα′ µ′β′ 计算; • 利用从直角坐标系到一般坐标系 {xµ′ } 的张量分量变换律计算。 标量的协变导数是啥?协变导数与普通偏导数的不同是由于基向量随着坐标变化。因为标量 不依赖于基向量,因此标量的协变导数等于普通的偏导数,也就是梯度: ∇α f = ∂f ∂xα ; ∇f = ˜ df. (5.53) 散度,Laplacian 在深入讨论之前,我们来研究一下与之前的内容有联系的部分。在直角坐标系中,向量 V α 的 散度是 V α ,α ,它是由 V α ,β 对上下指标缩并产生的标量。缩并是不依赖于坐标系的运算,因此 ⃗ V 的散度也可以在坐标系 {xµ′ } 中对 ∇⃗ V 的两个指标进行缩并得到,其结果为标量 V α′ ;α′ ,注意,它 与直角坐标系中的 V α ,α 是同一个量: V α ,α ≡ V β′ ;β′ (5.54) 其中不带撇的指标表示直角坐标系,带撇的表示任意坐标系。 极坐标系(简明起见,用不带撇的指标表示)中: V α ;α = ∂V α ∂xα + Γα µα Vµ . 根据(5.45)式可以算出: Γα rα =Γr rr + Γθ rθ = 1 r , Γα θα =Γr θr + Γθ θθ = 0.      (5.55)
  80. D raft T ranslation 74 CHAPTER 5. 曲率的序言 从而 V

    α ;α = ∂V r ∂r + ∂V θ ∂θ + 1 r V r, = 1 r ∂ ∂r (rV r) + ∂ ∂θ V θ. (5.56) 上式看起来很面熟。更面熟的是梯度的散度,也就是 Laplacian。但是散度是对向量定义的,而梯 度是个 1 形式,因此必须先把 1 形式转换为向量。给定一个标量场 ϕ,根据5.2节最后的(5.53)式可 得,相应的梯度向量的分量为 (ϕ,r , ϕ,θ /r2。将它带入向量的散度公式(5.56)可得 ∇ · ∇ϕ := ∇2ϕ = 1 r ∂ ∂r ( r ∂ϕ ∂r ) + 1 r2 ∂2ϕ ∂θ2 . (5.57) 这就是平面极坐标系中的 Laplacian 的表达式,它等同于 ∇2ϕ = ∂2ϕ ∂x2 + ∂2ϕ ∂y2 . (5.58) 1 形式与高阶张量的导数 标量场 ϕ 不依赖于基向量,它的导数 ˜ dϕ 与协变导数 ∇ϕ 相同,今后都采用符号 ˜ dϕ。为了计 算 1 形式的导数(和向量的导数一样并非仅仅是对分量求偏导数) ,我们利用 1 形式作用于向量得 到标量的性质。设 ˜ p 是 1 形式,⃗ V 是向量,对于固定的指标 β,∇β ˜ p 也是一个 1 形式,∇β ⃗ V 是向 量,而 ⟨˜ p, ⃗ V ⟩ ≡ ϕ 是标量场,在任意坐标系中: ϕ = pα V α. (5.59) 根据求导的乘积法则可以算出 ∇β ϕ: ∇β ϕ = ϕ,β = ∂pα ∂xβ V α + pα ∂V α ∂xβ . (5.60) 利用方程(5.50)可以将 ∂V α/∂xβ 用 V α ;β (即 ∇β ⃗ V 的分量)替换: ∇β ϕ = ∂pα ∂xβ V α + pα V α ;β − pα V µΓα µβ . (5.61) 重新安排各项,并且对 Christoffel 符号项的傀儡指标重命名可得: ∇β ϕ = ( ∂pα ∂xβ − pµ Γµ αβ ) V α + pα V α ;β (5.62) 对于任意向量 ⃗ V ,上式中括号之外的两项都已知是张量的分量,因此,由于张量分量的乘法加法得 到的结果都是新张量,因此括号中的项也是张量分量,这就是 1 形式 ˜ p 的协变导数: (∇β ˜ p)α := (∇˜ p)αβ := pα;β = pα,β − pµ Γµ αβ . (5.63)
  81. D raft T ranslation 5.4. CHRISTOFFEL 符号与度规 75 这样,(5.62)式写为 ∇β

    (pα V α) = pα;β V α + pα V α ;β 可见协变导数也服从乘积法则,和(5.60)式一样。实际上必须如此,因为在直角坐标系中 ∇ 就 是偏导数算符,上式在直角坐标系中退化为(5.60)式。 比较向量与 1 形式的协变导数(5.50)和(5.63)式: V α ;β =V α ,β + V µΓα µβ , pα;β =pα,β − pµ Γµ αβ . 它们有相似也有不同。只要记住求导的分量 β 总是 Γ 的最后一个指标,则其它指标的上下位置不 难确定。还需要记住符号的不同, 一个辅助的办法是记住 Γα µβ 与基向量的导数有关 (因此是正号) , 而 1 形式基的导数就对应 −Γα µβ ,符号的不同意味着 1 形式基的变换规律与基向量“相反” ,从而使 得缩并 ⟨˜ ωα,⃗ eβ ⟩ = δα β 在坐标变换下不变,其导数为零。 高阶张量的协变导数与方程(5.63)的推导过程同理,这里只给出结果: ∇β Tµν =Tµν,β − Tαν Γα µβ − Tµα Γα νβ ; (5.64) ∇β Aµν =Aµν ,β + AανΓµ αβ + AµαΓν αβ ; (5.65) ∇β Bµ ν =Bµ ν,β + Bα ν Γµ αβ − Bµ α Γα νβ . (5.66) 仔细观察会发现它们是很有规律的。在普通导数之外的每一项都分配一个 Γ,上指标就像向 量、下指标就像 1 形式那样进行处理。(5.64)式的几何意义是,∇β Tµν 是 ( 0 3 ) 张量 ∇T 的分量,其 中 T 是 ( 0 2 ) 张量。类似地,(5.65)式中,A 是 ( 2 0 ) 张量而 ∇A 是 ( 2 1 ) 张量,其分量为 ∇β Aµν。 5.4 Christoffel 符号与度规 上面的关于协变导数的推导没有涉及度规张量的任何内容,但是由于度规将向量与 1 形式联 系起来,因此这两者的协变导数之间必然有一些关系。在直角坐标系中,1 形式与相应的向量分量 相等,而 ∇ 在该系中就是普通求导算符,因此 1 形式与向量分量的协变导数在直角坐标系中必然 相等。这意味着任一向量 ⃗ V 及其相应的 1 形式 ˜ V = g(⃗ V , ) 在直角坐标系中有: ∇β ˜ V = g(∇β ⃗ V , ). (5.67) 上式是张量方程,在所有坐标系都成立,由此导出 Vα;β = gαµ V µ ;β (5.68)
  82. D raft T ranslation 76 CHAPTER 5. 曲率的序言 上式就是(5.67)式的分量形式。 上面的论述也许不让你满意,下面一步一步重新推导一遍。用不带撇的指标

    α, β, γ, . . . 表示 直角坐标系,带撇指标 α′, β′, γ′, . . . 表示任意坐标系。 我们的出发点是,在任意坐标系中,1 形式与向量分量的对应关系为: Vα′ = gα′µ′ V µ′ . (5.69) 而在直角坐标系中: gαµ = δαµ , Vα = V α. 在直角坐标系中,Christoffel 符号为零,因此在其中 Vα;β = Vα,β V α ;β = V α ,β 由此可得 Vα;β = V α ;β 这只在直角坐标系成立。为了将上式写成在任意坐标系都成立的形式,我们注意到在直角坐标系中 V α ;β = gαµ V µ ;β 由上两式可得 Vα;β = gαµ V µ ;β 这就写成了张量方程,在所有坐标系成立,于是再次得到了(5.68)式: Vα′;β′ = gα′µ′ V µ′ ;β′ (5.70) 上式有个重要推论。方程(5.69)对 β′ 坐标求协变导数可得 Vα′;β′ = gα′µ′;β′ V µ′ + gα′µ′ V µ′ ;β′ 上式与(5.70)式比较(注意 ⃗ V 是任意向量)可得 gα′µ′;β′ ≡ 0, (5.71)
  83. D raft T ranslation 5.4. CHRISTOFFEL 符号与度规 77 上式在任意坐标系都成立,它是方程(5.67)的推论,在直角坐标系中 gαµ;β

    ≡ gαµ,β = δαµ,β = 0, 它是个平凡的恒等式。而在一般坐标系中,度规的协变导数为零是不显然的,下面以极坐标系为例 计算一下以验证结论是否正确。 利用(5.64)式可得(以下不带撇指标表示一般坐标系) gαβ;µ = gαβ,µ − Γν αµ gνβ − Γν βµ gαν . (5.72) 在极坐标系中,考虑分量 α = r, β = r, µ = r: grr;r = grr,r − Γν rr gνr − Γν rr grν . 由于 grr,r = 0, Γν rr = 0, ∀ ν,因此上式平淡地等于零。对于分量 α = θ, β = θ, µ = r 就不那么平淡 了: gθθ;r = gθθ,r − Γν θr gνθ − Γν θr gθν . 带入 gθθ = r2, Γθ θr = 1/r, Γr θr = 0 可得 gθθ;r = (r2),r − 1 r (r2) − 1 r (r2) = 0. 就像某种魔法让它等于零一样,但是这不是魔法,只是因为在直角坐标系中 gαβ,µ = 0,而在任意 坐标系中的 gαβ;µ 与 gαβ,µ 是同一张量 ∇g 在不同坐标系的分量。 现在应该总结一下我们干了些什么。利用欧几里得空间中平行的概念,我们引入了协变微分, 然后证明了欧几里得空间的度规是协变不变的((5.71)式) 。之后讨论弯曲空间(Riemannian 空间) 的时候需要更仔细地研究平行,但是在那里(5.71)式仍然有效,因此以该方程为基础的所有讨论内 容也依然有效。 从度规计算 Christoffel 符号 (5.72)式等于零有一个极其重要的推论, 下面会看到, 利用(5.72)式可以用 Γµ αβ 表示 gαβ,µ , 而 反过来也可以,即用 gαβ,µ 表示 Γµ αβ ,这是计算 Christoffel 符号的简单方式。 为此,先得证明一个重要命题:在任意坐标系中 Γµ αβ ≡ Γµ βα 。为了证明这一对称性,考虑任 意张量场 ϕ,它的一阶导数 ∇ϕ 是分量为 ϕ,β 的 1 形式,它的二阶导数—— ( 0 2 ) 张量 ∇∇ϕ 的分量 为 ϕ,β;α ,在直角坐标系中,这些分量等于 ϕ,β,α := ∂ ∂xα ∂ ∂xβ ϕ, 它的 α, β 指标是对称的,因为偏导数互相对易。如果张量在一个坐标系中的指标对称,则在任意
  84. D raft T ranslation 78 CHAPTER 5. 曲率的序言 坐标系中的指标都对称。因此 ϕ,β;α

    = ϕ,α;β (5.73) 在任意坐标系成立,根据定义式(5.63)将上式展开: ϕ,β,α − ϕ,µ Γµ βα = ϕ,α,β − ϕ,µ Γµ αβ 在任意坐标系中。 而在任意坐标系中都有 ϕ,α,β = ϕ,β,α 由此可得 Γµ αβ ϕ,µ = Γµ βα ϕ,µ 对任意标量场 ϕ 成立,这就证明了在任意坐标系中 Christoffel 符号的对称性: Γµ αβ = Γµ βα . (5.74) 利用上式与(5.72)式,进行一些指标上的旋转跳跃就能得到(5.72)式的逆形式,将方程(5.72)进 行指标轮换: gαβ,µ =Γν αµ gνβ + Γν βµ gαν , gαµ,β =Γν αβ gνµ + Γν µβ gαν , −gβν,α = − Γν βα gνµ − Γν µα gβν . 以上三式相加,并利用 g 的对称性 gβν = gνβ 合并同类项: gαβ,µ +gαµ,β − gβµ,α =(Γν αµ − Γν µα )gνβ + (Γν αβ − Γν βα )gνµ + (Γν βµ + Γν µβ )gαν . 根据 Γ 的对称性 (5.74) 式,上式右侧前两项为零,于是 gαβ,µ + gαµ,β − gβµ,α = 2gαν Γν βµ . 就快要完成了。上式左右两边除以 2,乘以 gαγ(重复指标 α 表示求和) ,并且利用 gαγgαν ≡ δγ ν 可得
  85. D raft T ranslation 5.5. 非坐标基 79 1 2 gαγ(gαβ,µ

    + gαµ,β − gβµ,α ) = Γγ βµ . (5.75) 这就是利用度规 g 的分量及其导数表示 Christoffel 符号的表达式。例如,在极坐标系中: Γθ rθ = 1 2 gαθ(gαr,θ + gαθ,r − grθ,α ). 由于 grθ = 0 以及 gθθ = r−2,可以导出 Γθ rθ = 1 2r2 (gθr,θ + gθθ,r − grθ,θ ) = 1 2r2 gθθ,r = 1 2r2 (r2),r = 1 r . 这与前面推导的结果相同。这种计算 Christoffel 符号的方法是坠吼的,方程(5.75)值得记住。尽管 是在欧几里得空间推导的,但之后会看到它在弯曲空间中同样有效。 Γα βµ 的张量性 ⃗ eα 是个向量,∇⃗ eα 是个 ( 1 1 ) 张量,它的分量是 Γµ αβ ,这里的 α 固定而 µ, β 是分量指标:α 变化对应不同的张量 ∇⃗ eα ,而改变 µ 或 β 只是对应同一张量的不同分量。 因此,可以把 µ, β 视为分量指标,而把 α 视为指明不同张量的标签,每个基向量 ⃗ eα 对应这 样一个张量。然而这不太有用,因为在坐标变换之下,新旧坐标系的基向量不同,在新坐标系中重 要的张量是新的 ∇⃗ eβ′ ,它与旧的 ∇⃗ eα 的关系很复杂:它们是不同的张量,而非同一张量在不同坐 标系的分量。因此一个坐标系中的 Γµ αβ 不能由另一坐标系的 Γµ′ α′β′ 经过简单的变换得到。最简 单的例子是在直角坐标系中所有的 Γ 都为零,而在一般的坐标系中非零。因此很多教材都说 Γµ αβ 不是张量分量。从我们的观点来看,这话并不严格正确:Γµ αβ 是一组 ( 1 1 ) 张量 ∇⃗ eα 的 (µ, β) 分 量,只是不存在一个 ( 1 2 ) 张量的分量是 Γµ αβ ,因此形如 Γµ αβ V α 的表达式也不是单个张量的分量, 而组合 V β ,α + V µΓβ µα 是张量 ∇⃗ V 的分量。 5.5 非坐标基 之前所有的讨论都默认了非直角坐标系的基向量是由直角坐标 (x, y) 变换为某个 (ξ, η) 产生 的。然而,下面会看到,并非所有基向量场都可以通过这种方式得到,并且我们要研究需要什么条 件(不多)才可以。本书几乎不适用非坐标基,但是在平坦空间曲线坐标系的标准教材中却经常使 用它们,因此有必要对它们进行介绍。
  86. D raft T ranslation 80 CHAPTER 5. 曲率的序言 极坐标基 极坐标系的基向量的定义是

    ⃗ eα′ = Λβ α′ ⃗ eβ , 其中带撇指标表示极坐标,不带撇的表示直角坐标。此外, Λβ α′ = ∂xβ ∂xα′ , 这里将直角坐标 {xβ} 视为极坐标 {xα′ } 的函数。可以导出 ⃗ eα′ · ⃗ eβ′ ≡ gα′β′ ̸= δα′β′ , 这意味着极坐标系并非单位向量。 极坐标单位基 便利起见,经常定义单位基向量。容易导出极坐标系的单位基向量为: ⃗ eˆ r = ⃗ er , ⃗ eˆ θ = 1 r ⃗ eθ , (5.76) 相应的 1 形式基为 ˜ ωˆ r = ˜ dr, ˜ ωˆ θ = r˜ dθ. (5.77) 米娜桑应该自行证明 ⃗ eˆ α · ⃗ eˆ β ≡ g ˆ α ˆ β = δ ˆ α ˆ β , ˜ ωˆ α · ˜ ωˆ β ≡ gˆ α ˆ β = δˆ α ˆ β.    (5.78) 这样就定义了正交归一的向量与 1 形式基,用带帽号 ˆ 的指标表示。现在问题来了,是否存在坐标 系 (ξ, η) 使得 ⃗ eˆ α =⃗ eξ = ∂x ∂ξ ⃗ ex + ∂y ∂ξ ⃗ ey (5.79a) ⃗ eˆ θ =⃗ eη = ∂x ∂η ⃗ ex + ∂y ∂η ⃗ ey (5.79b) 成立? 如果成立,则 {⃗ eˆ α ,⃗ eˆ θ } 就是坐标系 (ξ, η) 的基向量,可以称之为坐标基;如果证明满足条件的 (ξ, η) 不存在,则这些向量是非坐标基。用相应的 1 形式基证明会更加容易,因此,下面要尝试找 到坐标系 (ξ, η) 使得 ˜ ωˆ r =˜ dξ = ∂ξ ∂x ˜ dx + ∂ξ ∂y ˜ dy, ˜ ωˆ θ =˜ dη = ∂η ∂x ˜ dx + ∂η ∂y ˜ dy.        (5.80)
  87. D raft T ranslation 5.5. 非坐标基 81 ˜ ωˆ r,

    ˜ ωˆ θ 关于 ˜ dr, ˜ dθ 的关系已知,因此根据(5.26)和(5.27)式可得 ˜ ωˆ r =˜ dr = cos θ˜ dx + sin θ˜ dy, ˜ ωˆ θ =r˜ dθ = − sin θ˜ dx + cos θ˜ dy.    (5.81) (不难验证 ˜ ωˆ r, ˜ ωˆ θ 是正交的) 如果 (ξ, θ) 存在,则 ∂η ∂x = − sin θ, ∂η ∂y = cos θ. (5.82) 如果上式成立,则混合导数相等: ∂ ∂y ∂η ∂x = ∂ ∂x ∂η ∂y . (5.83) 这意味着 ∂ ∂y (− sin θ) = ∂ ∂x (cos θ) (5.84) 也就是 ∂ ∂y ( y √ x2 + y2 ) + ∂ ∂x ( x √ x2 + y2 ) = 0. 上式当然不可能成立。因此 ξ, η 不存在:无法找到符合条件的坐标系。(If this manner of proof is surprising, try it on ˜ dr and ˜ dθ themselves.) 关于曲线坐标系中向量微积分的教材几乎都采用正交归一基,而非坐标基。例如,某个向量在 极坐标系坐标基 (coordinate basis, PC) 下的分量为 ⃗ V − − → PC (a, b) = {V α′ }, (5.85) 则它在正交基 (orthonormal basis, PO) 下的分量为: ⃗ V − − → PO (a, rb) = {V ˆ α}. (5.86) 例如,相关教材计算向量散度的公式为: (与我们导出的(5.56)式有所不同) ∇ · V = 1 r ∂ ∂r (rV ˆ r) + 1 r ∂ ∂θ V ˆ θ. (5.87) (5.56)和(5.87)式的不同只是因为 ⃗ V 的基向量不同。
  88. D raft T ranslation 82 CHAPTER 5. 曲率的序言 非坐标基总论 坐标基与非坐标基的主要区别是啥?考虑任意标量场

    ϕ, ⃗ eµ 是任意一组基当中的基向量, ˜ dϕ(⃗ eµ ) 是个标量,它可以记作 ˜ dϕ(⃗ eµ ) = ϕ,µ (5.88) 如果 ⃗ eµ 是坐标基的一员,则 ˜ dϕ(⃗ eµ ) = ∂ϕ/∂xµ,并且在之前的章节中定义过: ϕ,µ = ∂ϕ ∂xµ : 对坐标基成立。 (5.89) 但是,如果 ⃗ eµ 是非坐标基,则(5.89)式必然失效。如果用方程(5.88)来定义 ϕ,ˆ µ ,例如对极坐标单 位基 ⃗ eˆ θ = ⃗ eθ /r 有 ϕ ,ˆ θ = 1 r ∂ϕ ∂θ . (5.90) 一般情况下,对任意坐标系 {xβ} 与非坐标基 {⃗ eˆ α } 有 ∇ˆ α ϕ ≡ ϕ,ˆ α = Λβ ˆ α ∇β ϕ = Λβ ˆ α ∂ϕ ∂xβ (5.91) 因此按照(5.88)式的记号定义是很方便的,而 ϕ,µ = ∂ϕ/∂xµ 只对坐标基成立。 对于非坐标基,Christoffel 符号仿照之前的定义: ∇ˆ β ⃗ eˆ α = Γˆ µ ˆ α ˆ β ⃗ eˆ µ , (5.92) 只是协变导数的定义变成了 ∇ˆ β = Λα ˆ β ∂ ∂xα , (5.93) 其中 {xα} 是任意坐标系,{⃗ eˆ β } 是任意基(坐标基或非坐标基) 。然而不能证明 Γˆ µ ˆ α ˆ β = Γˆ µ ˆ β ˆ α ,因 为证明过程要用到 ϕ ,ˆ α, ˆ β = ϕ , ˆ β,ˆ α ,这只对坐标基才成立(偏导数互相对易) 。因此,用 gαβ,γ 表示 Γµ αβ 的(5.75)式也只对坐标基成立。一般的表达式在第5章习题 20 推导。 非坐标基不存在对应坐标系的一般原因是什么?设 {˜ ω¯ α} 是坐标 1 形式基,它与另一组 1 形 式基 {˜ dxα} 的关系为 ˜ ω¯ α = Λ¯ α β ˜ dxβ = ∂x¯ α ∂xβ ˜ dxβ. (5.94) 关键在于 Λ¯ α β ,它是坐标的函数,而且是偏导数 ∂x¯ α/∂xβ,因此根据混合偏导数不依赖求导次序 可得 ∂ ∂xγ Λ¯ α β = ∂2x¯ α ∂xγ∂xβ = ∂2x¯ α ∂xβ∂xγ = ∂ ∂xβ Λ¯ α γ . (5.95) 上式称为“可积性条件 (integrability conditions)” ,如果 ˜ ω¯ α 是坐标基,则所有的变换矩阵元 Λ¯ α β 都 要满足上式。显然,总可以构造不满足上式的变换矩阵,从而生成非坐标基。
  89. D raft T ranslation 5.6. 展望下一步 83 本书的非坐标基 我们几乎不会用到非坐标基,只要清楚理解存在非坐标基、并非所有基向量都可以从坐标系导 出就行了。坐标基的代数运算几乎总是更简单。

    那么,为啥向量分析的标准教材在讲述曲线坐标系的时候总是采用正交基呢?因为那是以欧 几里得空间为背景的,度规分量是 δαβ ,因此点乘的简单形式、向量与 1 形式的分量相等这些好的 性质直接来自于直角坐标系(它是唯一的正交坐标基! ) 。为了在向量与张量微积分中利用坐标基的 简单性,我们在前面花了大量时间学习了向量与 1 形式的不同! 5.6 展望下一步 这一章讨论了后面研究弯曲空间与时空的几乎所有符号和概念。5.2-5.4节特别重要,因为后面 会仿照这些内容建立描述曲率的数学工具,读者务必精读这几节。下一步要添加的内容是关于平行 的进一步讨论,以及计量欧几里得平行公理在弯曲空间的失效程度,进行计量的数学工具就是著名 的 Riemann 张量。 5.7 扩展阅读 Dicke (1964), Misner et al. (1973), Shapiro (1980), and Will (1993, 2006) 讨论了 Eötvös 与 Pound–Rebka–Snider 实验以及其它验证 GR 的实验。Hoffmann(1983) 用较少的数学讨论引入了 曲率。Ashby (2003) 提供了最新的关于相对论在 GPS 系统应用的综述。 如下文献从不同方面建立了曲线坐标系的数学工具:Abraham and Marsden (1978), Lovelock and Rund (1990), and Schutz (1980b). 5.8 习题
  90. D raft T ranslation Chapter 6 弯曲流形 6.1 微分流形,张量 弯曲空间的数学描述始于(而不止于)流形的概念。流形本质上是局域的像欧几里得空间的连

    续空间。曲率自身是赋予流形的概念,本章之后几节讲述赋予的过程。下面先来研究流形的概念, 可以把“流形”当成“空间”的一种花哨的说法。 流形 球面是个流形,n 维欧几里得空间中的 m 维“超平面”(m ≤ n) 也是。更抽象的例子是,三维欧 几里得空间直角坐标系的所有刚性旋转组成的集合也是流形。 从根本上说,流形是可以被连续地参数化的集合,独立参数的个数就是流形的维数,这些参数 称为流形的坐标。考虑上述例子,球面被两个坐标 θ, ϕ“参数化” ;m 维“超平面”有 m 个独立的直角 坐标;而所有刚性旋转的组合可以由三个“欧拉角”参数描述(其中两个参数描述了转轴的方向、一 个描述了旋转角) ,因此刚性旋转的集合是流形:流形中的每个点对应一个旋转变换,其坐标对应 三个欧拉角参数) ,这个集合是三维流形。 数学上,流形的点以及点的参数可以视为从流形的点到相应维数的欧几里得空间的映射,这就 是流形局域的像欧几里得空间的含义:流形是“光滑的”并且具有一定维数。必须强调,流形的大尺 度拓扑可能与欧几里得空间十分不同,例如圆环 (torus) 的表面不是欧几里得的,在拓扑上也不同。 但是圆环局域的像欧几里得空间:一小块圆环面可以与其切平面建立 1-1 映射。这是流形的一种 视角:流形是带坐标的空间,它局域的像欧几里得空间,而整体可以弯曲、扭曲、做几乎任意变换, 只要保持连续性就行。 微分结构 我们只考虑“微分流形”(differentiable manifolds),它们是连续且可微的空间。粗略地说,微分 流形的每一点的邻域都可定义从该邻域到欧几里得空间的光滑映射,该映射保证标量函数的导数 在那一点不变。球面是处处可微的,而锥面除了顶点以外处处可微。物理学用到的流形基本上都是 几乎处处可微的,GR 的弯曲流形就是如此。 可微性的条件直接意味着可以定义 1 形式与向量。也就是说,在流形上的某个坐标系中,集合 {ϕ,α } 的元素是 1 形式 ˜ dϕ 的分量;而集合 {aϕ,α + bψ,α }(其中 a, b 是函数)也是 1 形式场。类 85
  91. D raft T ranslation 86 CHAPTER 6. 弯曲流形 似的,任何曲线(带有参数,例如 λ)具有切向量

    ⃗ V ,它定义为将 1 形式 ˜ dϕ 变成“标量场沿该曲 线的导数 dϕ/dλ”的线性函数: ⟨˜ dϕ, ⃗ V ⟩ = ⃗ V (˜ dϕ) = ∇⃗ V ϕ = dϕ dλ . (6.1) 向量的线性组合也是向量。利用上面定义的向量和 1 形式,可以定义各种 ( M N ) 型张量,就像 SR 里定义的那样。由于目前尚未钦点任何 ( 0 2 ) 张量为度规,因此向量与 1 形式之间还没有对应关系。 不过其它内容与之前讨论的 SR 情形、极坐标系相同。这些内容都来自于微分,因此所有张量的集 合称为流形的“微分结构 (differential structure)”的一部分。我们不会经常使用这个术语。 回顾 这里应该回顾一下之前的张量代数的内容,我们总结为如下几条: 1. 张量场在流形的每一点定义了一个张量。 2. 向量与 1 形式是作用于对方、产生实数的线性算符,线性的含义是: ⟨˜ p, a⃗ V + b ⃗ W⟩ =a⟨˜ p, ⃗ V ⟩ + b⟨˜ p, ⃗ W⟩, ⟨a˜ p + b˜ q, ⃗ V ⟩ =a⟨˜ p, ⃗ V ⟩ + b⟨˜ q, ⃗ V ⟩, 其中 a, b 是任意标量场。 3. 张量是把 1 形式和向量变成实数的线性算符。 4. 如果两个同型张量在一个坐标系中的分量相等,则它们在任意坐标系的分量都相等,这两个 张量是等同的 (identical or equal or same)。只有同型张量才能相等。特别地,如果某个张量 在一个坐标系的分量全为零,则该张量在所有坐标系的分量都为零,这个张量叫做零张量。 5. 如下的张量场运算称为“允许的张量运算” ,因为运算结果是新张量的分量: (a) 张量场乘以标量场,得到同型的新张量场。 (b) 两个同型张量场相加,得到同型的新张量场。 (只有同型张量场才能相加) (c) 两个任意类型的张量场相乘,例如 ( A B ) 型与 ( C D ) 型张量场相乘,得到 ( A+C B+D ) 型张量场, 称为这两个张量场的外积 (outer product)。 (d) ( N M ) 型张量场分量的协变微分(之后会讨论) ,得到 ( N M+1 ) 张量场的分量。 (e) ( N M ) 张量指标的一对上下指标进行缩并 (contraction),得到 ( N−1 M−1 ) 张量的分量。 6. 如果张量分量的方程当中都是允许的张量运算(称之为张量方程) ,只要该方程在一个坐标系 中成立,那么在任意坐标系都成立。这个结果十分有用。其依据是,根据上一条,张量方程 是两个同型张量的分量的等式,再根据上数第二条,该等式在任意坐标系都成立。 6.2 Riemannian 流形 目前为止尚未在流形中引入度规。在一些问题的流形中,度规是不必要或不常用的。但是对 GR 而言,度规绝对是最基本的,因为就像 SR 那样,度规描述了钟的走时与两点的距离。一个微 分流形配上一个被选召为度规的、对称的 ( 0 2 ) 张量场 g,称为 Riemannian 流形(黎曼流形) 。严格 来说,只有当度规是正定的——即 ∀ ⃗ V ̸= 0, g(⃗ V , ⃗ V ) > 0——才叫做 Riemannian 流形;SR 与 GR 那样的不定度规情况叫做 pseudo-Riemannian(伪黎曼流形) 。不过作为一本物理书我们并不区分
  92. D raft T ranslation 6.2. RIEMANNIAN 流形 87 统统称为 Riemannian

    流形。 选出一个度规意味着在流形上“添加”某种结构,理解这一点很关键, 之后会看到这个度规完全定义了流形的曲率。因此,选定一个度规 g 之后,流形具有了一种曲率 (例如,球面) ,而选择另一个度规 g′ 流形具有另一种曲率(例如,旋转椭球面) 。 “原始的”微分流形 自身是一团无定形的点的集合,并且局域的相似于欧几里得空间中的点的排布,其中的距离与形状 并未指定。给定了度规 g 就赋予了流形以特定形状,后面就会看到。从现在开始,我们讨论的对象 是 Riemannian 流形,其上的每一点都定义了度规 g。 为了内容完整,我们指出,可以不利用度规来定义流形曲率的概念(称为“仿射 (affine)”流 形) 。有些文献用采用这种方法,但是度规在 GR 中的地位是基本的,因此我们利用度规定义流形 曲率。 度规,局域平直性 自然,度规提供了每一点的向量与 1 形式之间的映射。因此,给定向量场 ⃗ V (P)(这个符号意 味着 ⃗ V 取决于位置 P,P 是流形中的任一点) ,它唯一对应于 1 形式场 ˜ V (P) = g(⃗ V (P), )。这个 映射必须是可逆的画外音:看不出来……,因此 ˜ V (P) 也对应唯一的 ⃗ V (P)。g 的分量记作 gαβ ;分 量矩阵的逆矩阵记作 gαβ。度规可以升降指标,就像 SR 中的那样: Vα = gαβ V β. 一般的 {gαβ } 是坐标的复杂函数,因此在一般的坐标系中,向量与 1 形式分量,例如 V 0 与 V0 ,一 般没有简单的关系。 要研究一般的弯曲流形就要在一般的坐标系中考虑问题。 SR 只在 Lorentz 系 (惯性系) 中讨论 (因为简单) , 但是引力使得全局惯性系不存在, 因此我们得考虑所有的 (一般性的) 坐标系, 以及所 有的(一般性的)非奇异坐标变换。非奇异性在5.2节介绍过,它意味着变换矩阵 Λα′ β ≡ ∂xα′ /∂xβ 可逆。 根据定义,度规分量矩阵 (gαβ ) 是对称的,线性代数的一条重要定理(见第6章习题 3)告 诉我们,对于任意对称矩阵 (gα′β′ ),总可以找到变换矩阵将 (gα′β′ ) 化为对角元是 +1, −1 或 0 的 对角矩阵,且 +1 的数量等于矩阵 (gα′β′ ) 的正特征值的个数、−1 的数量等于负特征值个数。故而, 如果一开始选择 g 的分量矩阵具有 3 个正特征值、1 个负特征值,则总可以找到变换矩阵 Λα′ β 使 得度规分量变换为: (gα′β′ ) =         −1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1         ≡ (ηαβ ). (6.2) 今后,ηαβ 专指上式中的矩阵,也就是 SR 的度规。 有两点重要内容必须指出。 第一, 只有 (gαβ ) 选为 3 个正特征值、 1 个负特征值的时候, (6.2)式 才可能。(6.2)式矩阵的对角元素之和称为度规的号差 (signature),SR 与 GR 的度规号差都是 +2。 因此,之前我们论述过,在任意事件处总可以构造一个局域惯性系,方程(6.2)是这个物理命题的数 学表述,亦即,该点的度规总可以变换为 ηαβ 。反过来,这意味着一个描述有引力时空的度规的号 差必须是 +2。 第二,(6.2)式对应的变换矩阵 Λα′ β 也许并非坐标变换。也就是说,集合 {˜ ωα′ = Λα′ β ˜ dxβ} 也
  93. D raft T ranslation 88 CHAPTER 6. 弯曲流形 许不是坐标基。根据前面对非坐标基的讨论,Λα′ β

    只有当(5.95)式成立时才是坐标变换: ∂Λα′ β ∂xγ = ∂Λα′ γ ∂xβ . 这在一般的引力场中不能成立,否则就意味着存在(6.2)式处处成立的坐标系——全局惯性系 了。不过,既然可以使(6.2)式在 P 点成立,那么也可以找到坐标系使得(6.2)式在 P 点的邻域“近 似”成立。这体现在如下的定理中,该定理的证明(相当长)见本节最后。对于流形上的任一点 P, 可以找到原点为 P 点的坐标系 {xα},在该坐标系中: gαβ (xµ) = ηαβ + 0[(xµ)2]. (6.3) 这意味着,P 点附近的度规近似是 SR 的度规,相差坐标的二阶量。今后称这种坐标系为“局域 Lorentz 系”或“局域惯性系 (local inertial frames, LIF)”。方程(6.3)可以表示为更精确的形式: gαβ (P) = ηαβ ∀ α, β; (6.4) ∂ ∂xγ gαβ (P) = 0 ∀ α, β, γ; (6.5) 但是在一般情况下 ∂2 ∂xγ∂xµ gαβ (P) ̸= 0 在弯曲流形中,上式至少对某些 α, β, γ, µ 成立。 局域惯性系的存在性等价于弯曲空间中的任一点存在“相切”的平坦空间。平直时空中,自由粒 子的世界线是直线;方程(6.5)中弯曲时空度规的一阶导数项为零意味着,弯曲时空中的自由粒子 沿着在局域惯性系中的“局域直”的线运动。由于物理学方程在平直时空中最简单,而按照6.1节总结 的规律,只要在局域惯性系写出张量等式的方程,则该方程在任意坐标系都有效,因此局域惯性系 十分有用。别忘了定理的证明在本节最后,尽管比较长,但是它值得研究。 长度与体积 度规定义了曲线的长度。将曲线上的无穷小位移向量记作 d⃗ x,则 d⃗ x 长度的平方 ds2 = gαβ dxαdxβ (回顾一下, 前面称之为度规的线元) 。 对它的绝对值开平方就是长度:dℓ ≡ |gαβ dxαdxβ|1/2, 再进行积分: ℓ = ∫ 沿曲线 |gαβ dxαdxβ|1/2 (6.6) = ∫ λ1 λ0 gαβ dxα dλ dxβ dλ 1/2 dλ, (6.7)
  94. D raft T ranslation 6.2. RIEMANNIAN 流形 89 其中 λ

    是曲线的参数(端点处的参数值为 λ0 , λ1 ) 。由于曲线的切向量 ⃗ V 的分量为 V α = dxα/dλ, 上式可写为: ℓ = ∫ λ1 λ0 |⃗ V · ⃗ V |1/2 dλ, (6.8) 这就是任意曲线的长度。 在对时空区域进行积分时,计算体积十分重要。这里的“体积”是指四维体积元,它出现于4.4节 Gauss 定律的积分中。局域惯性系的无穷小四维体元的四维体积为 dx0 dx1 dx2 dx3,其中 {xα} 是 原点在指定点的局域惯性系,满足方程(6.3)。在任意坐标系 {xα′ } 中,根据多变量微积分的知识可 得: dx0 dx1 dx2 dx3 = ∂(x0, x1, x2, x3) ∂(x0′ , x1′ , x2′ , x3′ ) dx0′ dx1′ dx2′ dx3′ , (6.9) 其中 ∂( )/∂( ) 是从 {xα′ } 到 {xα} 的变换的 Jacobian(雅可比行列式) ,在5.2节定义过: ∂(x0, x1, x2, x3) ∂(x0′ , x1′ , x2′ , x3′ ) = det      ∂x0/∂x0′ ∂x0/∂x1′ . . . ∂x1/∂x0′ . . .      = det(Λα β′ ). (6.10) 计算 Jacobian 的过程相当繁琐,不过利用度规可以简化计算过程。度规分量变换的矩阵形式为 (g) = (Λ)(η)(Λ)T , (6.11) 其中 (g) 表示矩阵 gαβ ,(η) 表示 ηαβ ,等等。符号 T 表示矩阵转置。上式取行列式: det(g) = det(Λ) det(η) det(ΛT ). (6.12) 转置矩阵的行列式与原矩阵相等: det(Λ) = det(ΛT ), (6.13) 而根据(6.2)可得 det(η) = −1. (6.14) 综上, det(g) = −[det(Λ)]2. (6.15)
  95. D raft T ranslation 90 CHAPTER 6. 弯曲流形 引入记号 g

    := det(gα′β′ ), (6.16) 这样方程(6.15)可以写为 det(Λα β′ ) = (−g)1/2. (6.17) 从而,根据(6.9)式可得: dx0 dx1 dx2 dx3 = [ − det(gα′β′ ) ]1/2 dx0′ dx1′ dx2′ dx3′ = (−g)1/2 dx0′ dx1′ dx2′ dx3′ . (6.18) 这个结果非常有用。这个式子的推导思路也很重要,因为这是第一个利用局域惯性系将平直时 空的结果推广到弯曲时空的例子, 之后会经常利用这种思路。 本例从局域惯性系的体元 dx0 dx1 dx2 dx3 = d4x 出发,由于给定点附近的时空邻域和 Minkowski 空间相同,因此这个体元就是可以由时钟与 尺子测量的物理量。接着我们导出了在任意坐标系 {xµ′ } 的体元表达式(6.18),(−g)1/2d4x′,这就 是弯曲时空中任意坐标系的任一点的物理体积元,我们称之为固有体元 (proper volume element)。 度规出现在固有体元里,这是在意料之中的,因为度规测量长度。任意坐标系的 d4x 乘以 (−g)1/2 就得到的真实的,或者说固有的 (proper) 体元。 这里应该举个三次元欧几里得空间的例子,由于该空间的度规是正定的((6.14)的对应结果是 +1) ,因此固有体元应该乘以 (g)1/2。球坐标系的线元 dℓ2 = dr2 + r2dθ2 + r2 sin2 θdϕ2,因此度规 是 (gij ) =      1 0 0 0 r2 0 0 0 r2 sin2 θ      . (6.19) 度规行列式等于 r4 sin2 θ,所以固有体元 (g)1/2 d3x′ 等于 r2 sin θdrdθdϕ, (6.20) 这就是人们熟悉的极坐标系的体积元。
  96. D raft T ranslation 6.2. RIEMANNIAN 流形 91 局域平直性定理的证明 记

    {xα} 是任意坐标系,{xα′ } 是局域惯性系:它在所考虑的 P 点附近简化为惯性系(四维时 空流形中的点就是一个事件) 。这两个坐标系之间的坐标变换为: xα = xα(xµ′ ), (6.21) Λα µ′ = ∂xα/∂xµ′ . (6.22) 将 Λα µ′ 在 P 点(该点的坐标是 xµ′ 0 )附近作 Taylor 展开,其中 ⃗ x 是 P 点附近的一点: Λα µ′ (⃗ x) =Λα µ′ (P) + (xγ′ − xγ′ 0 ) ∂Λα µ′ ∂xγ′ (P) + 1 2 (xγ′ − xγ′ 0 )(xλ′ − xλ′ 0 ) ∂2Λα µ′ ∂xλ′ ∂xγ′ (P) + . . . , =Λα µ′ P + (xγ′ − xγ′ 0 ) ∂2xα ∂xγ′ ∂xµ′ P + 1 2 (xγ′ − xγ′ 0 )(xλ′ − xλ′ 0 ) ∂3xα ∂xλ′ ∂xγ′ ∂xµ′ P + . . . . (6.23) 将度规进行同样的展开: gαβ (⃗ x) =gαβ P + (xγ′ − xγ′ 0 ) ∂gαβ ∂xγ′ P + 1 2 (xγ′ − xγ′ 0 )(xλ′ − xλ′ 0 ) ∂2gαβ ∂xλ′ ∂xγ′ P + . . . . (6.24) 将以上两个两坨方程带入度规的变换式当中: gµ′ν′ = Λα µ′ Λβ ν′ gαβ , (6.25) 可得: gµ′ν′ (⃗ x) =Λα µ′ P Λβ ν′ P gαβ P + (xγ′ − xγ′ 0 ) [ Λα µ′ P Λβ ν′ P gαβ,γ′ P + Λα µ′ P gαβ P ∂2xβ ∂xγ′ ∂xν′ P + Λβ ν′ P gαβ P ∂2xα ∂xγ′ ∂xµ′ P ] + 1 2 (xγ′ − xγ′ 0 )(xλ′ − xλ′ 0 ) [ . . . ] , (6.26) 我们不知道坐标变换(6.21)式的具体形式,但是可以通过 Taylor 展开来定义它,为此首先来计算自 由变量的个数。 • 变换矩阵 Λα µ′ 有 16 个指标,它们都对应自由变量。 • 数组 {∂2xα/(∂xγ′ ∂xµ′ ) P } 有 4 × 10 = 40 个自由指标(并非 4 × 4 × 4 个,因为指标 γ′ 与 µ′ 对称) 。 • 数组 {∂3xα/(∂xλ′ ∂xγ′ ∂xµ′ ) P } 有 4 × 20 = 80 个自由变量,因为可以任意更换指标 λ′, γ′, µ′
  97. D raft T ranslation 92 CHAPTER 6. 弯曲流形 的顺序,这种对称性导致一个固定的 α

    只对应 20 个独立变量。这种三个指标的对称性的独 立变量数的一般结论是 n(n + 1)(n + 2)/3!,其中 n 是每个指标可能取值的个数,对于我们 的情况是 n = 4. • 另一方面, gαβ P , gαβ,γ′ P , gαβ,γ′µ′ P 都是最初给定的, 它们分别具有 10, 10×4 = 40, 10×10 = 100 个独立分量。 第一个问题是,是否可以满足方程(6.4): gµ′ν′ P = ηµ′ν′ ? (6.27) 上式可以写为 ηµ′ν′ = Λα µ′ P Λβ ν′ P gαβ P . (6.28) 根据对称性,上式对应 10 个独立方程。我们有 16 个自由的 Λα µ′ P 来满足这些方程,因此这些方 程是可以解出的,并且留下了 6 个 Λα µ′ P 尚未确定,这余下的 6 个变量对应于保证度规 ηµ′ν′ 不 变的 Lorentz 变换的自由度。也就是说,可以对坐标系进行绕某个方向(确定该方向需要 2 个参 数)的转轴旋转角度 θ(1 个参数)的速度为 v(含有 3 个自由参数)的推动 (boost) 变换,这就 给出了 Λα µ′ P 的 6 个自由度,局域惯性系经过这种变换还是惯性系。 下一个问题是, 是否可以安排(6.26)式中 ∂Λα µ′ /∂xγ′ P (它具有 40 个自由变量) , 使得方程(6.5): gα′β′,µ′ P = 0. (6.29) 的 40 个独立方程成立? 既然是 40 个方程、40 个未知数,那么答案是“可以” ,不多不少刚刚好。给定矩阵 Λα µ′ P ,有 且仅有一种安排 P 点附近坐标的方式,使得 Λα µ′,γ′ P 的取值使得 gα′β′,µ′ P = 0. 因此不再有额外 的、进行局域 Lorentz 变换的自由度。 最后的问题是,是否可以使更高阶的项成立?可以安排 Λα µ′,γ′λ′ P 的 80 个自由变量,使得 gα′β′,µ′λ′ P = 0 代表的 100 个独立方程成立吗?既然变量个数 80 小于方程数 100,问题的答案是 “不行”。对于一般的度规,二阶导数 gα′β′,µ′λ′ P 有着 20 个“自由度”,由于 100 − 80 = 20,一般而 言有 20 个分量不能为零。 由此可见,一般的度规在任一点 P 的主要特征既不是由度规在 P 点的值表示(因为它可以变 换为 ηαβ ) ,也不是由它的 1 阶导数表示(因为 1 阶导数可以变换为零) ,而是由不可变换为零的 20 个二阶导数所表征的。后面会看到,这 20 个量是表征曲率的张量的独立分量。当然,在平直空 间中,这 20 个量都等于零,不过在一般的弯曲空间中不是这样。 6.3 协变微分 现在来讨论微分。根据定义,向量场的导数要计算两个不同点(取极限之后这两个点重合)的 向量的差。弯曲空间中不同点的向量之差必须小心处理,因为两点之间的空间是弯曲的,两点的向 量方向“相同”这一概念是模糊的。然而, Riemannian 流形的局域平直性可以帮助解决这个问题。计 算导数只需要比较两个无限接近的点的向量,而我们知道在任一点 P 的邻域可以建立与平直空间
  98. D raft T ranslation 6.3. 协变微分 93 接近的坐标系。因此在这个小邻域中,流形可以视为平直的,如果一个向量的分量在这个坐标系中 是常数,那么很自然地认为该向量分量的导数在 P

    点为零。例如,按这种说法,局域惯性系基向 量的导数在 P 点为零。 强调一下,上述内容就是协变导数 (covariant derivative) 的定义。它从物理上看起来很合理: 局域惯性系的时空的局部看起来像 SR 的情况,在 SR 中基向量的导数等于零。从这个定义可以直 接导出,在局域惯性系的 P 点,向量分量的协变导数等于分量的偏导数(即,Christoffel 符号为 零) : V α ;β = V α ,β 在局域惯性系,P 点。 (6.30) 上述论证对其它张量,例如度规张量,也成立: gαβ;γ = gαβ,γ = 0 在 P 点。 (其中第二个等号来自方程(6.5)。既然张量方程 gαβ;γ = 0 在一个坐标系(局域惯性系)成立,则它 在任意坐标系都成立: gαβ;γ = 0 在任意坐标系都成立。 (6.31) 这个超级重要的结论直接来自于协变导数的定义,回顾5.4节,如果有 Γµ αβ = Γµ βα ,则方 程(6.31)可以导出方程(5.75)(对任意度规都成立) : Γα µν = 1 2 gαβ(gβµ,ν + gβν,µ − gµν,β ). (6.32) 推导过程作为本章习题 5,提示一下,仿照前面在平直空间的论证思路,现在在局域惯性系 讨论,Γµ βα 在任意坐标系中都是对称的。 (未完成)我们的出发点是假设在局域惯性系的 P 点 有 Γα µν = 0。但是要指出 Γα µν 的导数在该系 P 点一般不等于零,因为它涉及了度规的二阶导数 gαβ,γµ 。Christoffel 符号的导数在 P 点非零意味着,即使可以找到坐标系使得 Γα µν 在 P 点的值 为零,Γα µν 在该系中其它点的值也不为零。由此可见,在任意给定点,一般的弯曲流形与平坦流 形的差别在于 Christoffel 符号的导数。 方程(6.32)意味着,给定 gαβ 就可以计算所有 Γα µν 。由此可以导出所有其它协变导数(在给定 度规 g 之后) ,例如:
  99. D raft T ranslation 94 CHAPTER 6. 弯曲流形 V α

    ;β =V α ,β + Γα µβ V µ, (6.33) Pα;β =Pα,β − Γµ αβ Pµ , (6.34) Tαβ ;γ =Tαβ ,γ + Γα µγ Tµβ + Γβ µγ Tαµ. (6.35) 散度公式 向量的散度十分常用。给定任意向量场 V α,它的散度由(5.53)式定义: V α ;α = V α ,α + Γα µα V µ. (6.36) 上式含有 Christoffel 符号的求和,根据方程(6.32)可得 Γα µα = 1 2 gαβ(gβµ,α + gβα,µ − gµα,β ) = 1 2 gαβ(gβµ,α − gµα,β ) + 1 2 gαβgαβ,µ (6.37) 上式拆项是为了进行简化:注意括号中的项关于 α, β 反对称,而与之缩并的 gαβ 是对称的,因此 根据第三章习题 26(a),第一项为零,由此可得 Γα µα = 1 2 gαβgαβ,µ (6.38) 由于 (gαβ) 是 (gαβ ) 的逆矩阵,可以证明矩阵 (gαβ ) 的行列式 g 的导数为(证明过程作为本章习题 7) : g,µ = ggαβgβα,µ (6.39) 结合方程(6.38)可得 Γα µα = ( √ −g),µ √ −g . (6.40) 这样,向量的散度(6.36)式化为 V α ;α = V α ,α + 1 √ −g V α( √ −g),α , (6.41) 进一步整理为
  100. D raft T ranslation 6.4. 平行移动,测地线,曲率 95 V α ;α

    = 1 √ −g ( √ −gV α),α (6.42) 上式比方程(6.36)更好用。除了散度,高斯定律也很重要,对向量散度在某一区域进行体积分 (当然,体积元是固有体元) : ∫ V α ;α √ −g d4x = ∫ ( √ −gV α),α d4x. (6.43) 上式等号右侧的项就是普通的偏导数,因此可以利用高斯定律,就像 SR 中那样(见4.8节) : ∫ ( √ −gV α),α d4x = V αnα √ −g d3S. (6.44) 由此可得 ∫ V α ;α √ −g d4x = V αnα √ −g d3S. (6.45) 因此弯曲流形的高斯定律形式为(6.45)式。向量散度对固有体元的体积分,可以转化为在积分 区域表面上的对固有面积元 (proper surface element)nα √ −g d3S 的面积分。 6.4 平行移动,测地线,曲率 迄今为止,我们利用局域平直性定理导出了弯曲流形的尽可能多的数学内容,而避免直接考 虑曲率。现在就要对曲率进行精确的数学定义。必须要区分两种曲率:固有 (intrinsic) 曲率和外 (extrinsic) 曲率。例如,考虑一个圆柱面,人们认为它是弯曲的,它的曲率是外曲率:这种弯曲面 是三维平直空间的一部分。换句话说,将一张纸卷起来(而不需要撕裂、挤压等等)就得到了圆柱 面,因此圆柱面的内禀几何与原始的纸张相同——是平直的。这意味着圆柱面上的任意两点之间的 距离与纸张上相同的两点距离相等,平行线永远保持平行,等等,总之所有欧几里得公理在圆柱面 上也有效。只能在圆柱面上运动的二维“蚂蚁”会认为它生活的空间是平直的;只不过整体拓扑很滑 稽,沿着直线一直向前运动会回到出发点。n 维流形的内禀几何只考虑联系各点的、位于流形内部 的路径(对于圆柱面而言,就是其上的二维路径) ,柱面的外曲率涉及到了从它的表面到高维空间 的路径,并且比较了柱面内部曲线与离开柱面的“直线”。因此外曲率依赖于高维空间。本书只考虑 时空的内禀曲率,因为所有世界线都在时空当中。是否存在四维时空之外的高维空间仍然是开放的 问题,这个问题在弦理论的框架下被越来越多的讨论。GR 只考虑时空的内禀几何。 (未完成)
  101. D raft T ranslation 96 CHAPTER 6. 弯曲流形 平行移动 上面在球面上进行的构造称为“平行移动

    (parallel-transport)” 。设 ⃗ V 是定义在球面上的向量场, 我们想要研究它沿一条曲线如何变化,如图6.1。 图 6.1: 向量 ⃗ V 沿曲线(切向量 ⃗ U)平行移动。 如果在曲线上相距无穷小两点的向量 ⃗ V 相互平行且长度相等,则称 ⃗ V 沿着该曲线平行移动1 (简称平移) ,这可以很容易地用方程描述。设曲线的参数 λ,切向量 ⃗ U = d⃗ x/dλ(⃗ U 不一定是归一 化的) ,则在曲线任一点 P 的局域惯性系中,⃗ V 的分量必须沿着 P 附近的曲线不变: dV α dλ = 0 在 P 点。 (6.46) 这可以表示为: dV α dλ = UβV α ,β = UβV α ;β = 0 在 P 点。 (6.47) 其中, 第一个等号来自 V α 沿曲线导数的定义;第二个等号来自局域惯性系中的 P 点有 Γα µν = 0; 第三个等号 UβV α ;β = 0 是个张量方程,在任意坐标系都成立,因此,⃗ V 沿着 ⃗ U 平行移动的定义 不依赖于坐标系的形式为: UβV α ;β = 0 ⇔ d dλ ⃗ V = ∇⃗ U ⃗ V = 0. (6.48) 其中用到了沿着 ⃗ U 的导数的记号,见(3.67)式。 测地线 平直空间最重要的曲线是直线。欧几里得公设的其中一条是,两条最初平行的直线延伸下去总 保持平行。 “延伸”的意思是啥?当然不是意味着“保持两条线之间的距离不变” ,否则两条同时掰弯的 直线也算作平行了。 “延伸”意味着保持最初的方向一直进行下去,更精确地说,曲线下一点的切向 量与上一点的切向量平行。实际上,直线是欧几里得空间中唯一的切向量沿自身平行移动的曲线! 弯曲空间也可以通过要求曲线的切向量沿曲线自身平行移动以得到“尽量直”的线,这种线称为测地 线 (geodesics): 1这里“平行移动”是形容词,而前面出现的“平行移动”有时是动词。
  102. D raft T ranslation 6.5. 曲率张量 97 {⃗ U 是测地线的切向量}

    ⇔ ∇⃗ U ⃗ U = 0. (6.49) (注意,在局域惯性系中,测地线是直的)上式用分量记号写为: UβUα ;β = UβUα ,β + Γα µβ UµUβ = 0. (6.50) 设曲线的参数为 λ,则 Uα = dxα/dλ 以及 Uβ∂/∂xβ = d/dλ: d dλ ( dxα dλ ) + Γα µβ dxµ dλ dxβ dλ = 0. (6.51) Christoffel 符号 Γα µβ 是坐标 {xα} 的已知函数,因此上式是关于 xα(λ) 的非线性(准线性) 、 二阶微分方程组。在 λ = λ0 的初始条件 xα 0 = xα(λ0 ) 与 Uα 0 = (dxα/dλ)λ0 给定之后,方程组有 唯一解。因此,给定初始位置 (xα 0 ) 与初始方向 (Uα 0 ) 就确定了唯一的测地线。 回顾一下,如果对参数进行变换,那么从数学上说就得到了不同的曲线(尽管曲线经过的点不 变) 。设 λ 是某测地线的参数(即方程(6.51)成立) ,如果定义新参数 ϕ = aλ + b, (6.52) 其中 a, b 是常数(不依赖于曲线上的位置) ,则 ϕ 也是测地线参数,方程(6.51)对 ϕ 也成立: d2xα dϕ2 + Γα µβ dxµ dϕ dxβ dϕ = 0. 一般而言,测地线参数 λ 只有经过(6.52)式那样的变换之后得到的新参数才仍然是测地线参数,上 面的 λ, ϕ 称为仿射 (affine) 参数。如果一条曲线的路径与测地线相同,而它的参数并非仿射参数, 则严格说来它不是测地线。 测地线也是任意两点之间的极值长度 (extremal length) 曲线:其长度在曲线的一阶微小变 化之下的变化量为零。读者一定要尝试证明这个命题,从曲线长度的定义(6.7)式出发,找到固定 λ0 , λ1 的极值长度曲线所满足的 Euler-Lagrange 方程,然后结合(6.32)式证明所导出的极值曲线满 足测地线方程(6.51)式,这是个十分有益的练习。此外,读者还可以证明测地线的固有长度是一种 仿射参量(见本章习题 13-15) 。 6.5 曲率张量 终于到了对流形的内禀曲率进行精确的数学描述的时候了。回到之前的向量沿着闭合路径平 行移动的例子,从这个例子可以导出曲率的定义。考虑流形上的一个很小的闭合路径(如图6.2) 。
  103. D raft T ranslation 98 CHAPTER 6. 弯曲流形 图 6.2:

    一小块坐标网格。 封闭路径由四条坐标线 x1 = a, x1 = a + δa, x2 = b, x2 = b + δb 组成。定义在 A 点的向量 ⃗ V 沿路径 AB 平移到 B 点。平移条件 ∇⃗ e1 ⃗ V = 0 的分量为: ∂V α ∂x1 = −Γα µ1 V µ. (6.53) 将上式从 A 到 B 积分: V α(B) =V α(A) + ∫ B A ∂V α ∂x1 dx1 =V α(A) − ∫ x2=b Γα µ1 V µ dx1, (6.54) 其中“x2 = b”表示积分是沿着路径 AB 进行的。从 B 到 C 到 D 的过程同理: V α(C) =V α(B) − ∫ x1=a+δa Γα µ2 V µ dx2, (6.55) V α(D) =V α(C) + ∫ x2=b+δb Γα µ1 V µ dx1. (6.56) 最后一个方程的符号不同,因为从 C 到 D 的积分是沿 x1 坐标轴的负方向进行的。封闭路径的最 后一步是: V α(Afinal ) = V α(D) + ∫ x1=a Γα µ2 V µ dx2. (6.57) 经过平移之后 V α(A) 的变化记作 δV α,可以根据(6.54)-(6.57)式计算: δV α =V α(Afinal ) − V α(Ainitial ) = ∫ x1=a Γα µ2 V µ dx2 − ∫ x1=a+δa Γα µ2 V µ dx2 + ∫ x2=b+δb Γα µ1 V µ dx1 − ∫ x2=b Γα µ1 V µ dx1. (6.58) 注意,如果 Γα µν 与 V µ 在路径各点的值相同(平直空间里就是那样) ,则上面各项就会相消为零。
  104. D raft T ranslation 6.5. 曲率张量 99 但是在弯曲空间中并非如此,我们把被积函数相同的项合并,并且沿积分路径展开到一阶项: δV α

    ≈ − ∫ b+δb b δa ∂ ∂x1 (Γα µ2 V µ) dx2 + ∫ a+δa a δb ∂ ∂x2 (Γα µ1 V µ) dx1 (6.59) ≈δaδb [ − ∂ ∂x1 (Γα µ2 V µ) + ∂ ∂x2 (Γα µ1 V µ) ] . (6.60) 上式含有 Christoffel 符号的导数以及 V α 的导数。V α 的导数可以利用(6.53)式替换,这样方 程(6.60)化为: δV α = δaδb [ Γα µ1,2 − Γα µ2,1 + Γα ν2 Γν µ1 − Γα ν1 Γν µ2 ] V µ. (6.61) (上式的推导过程中对 Γ 的二次项重命名了傀儡指标)由上式可得,向量分量平移后的变化量等于 某个数乘以 V µ 并对 µ 求和。指标 1, 2 出现是由于平移路径是 x1, x2 坐标网格。而指标 1, 2 的反 对称性是因为,如果沿相反方向绕着闭合路径积分(即,交换 1, 2 的地位) ,则变化量 δV α 变号。 沿着一般的坐标线 xσ, xλ 平移的结果为: δV α =将 V α 首先沿 δa⃗ eσ 平移,然后是 δb⃗ eλ ,接着是 −δa⃗ eσ , 最后是 −δb⃗ eλ ,沿该闭合路径平移一周后的变化量 =δaδb [ Γα µσ,λ − Γα µλ,σ + Γα νλ Γν µσ − Γα νσ Γν µλ ] V µ. (6.62) 可见,δ 与封闭路径所围的坐标“面积”δaδb 有关。如果把闭合路径一个方向上的长度加倍,则 δV α 显然也加倍,这意味着 δ 线性依赖于 δa⃗ eσ 和 δb⃗ eλ 。此外,δV α 还线性依赖于 V α 自身以及 ˜ ωα, 后者将向量 δ⃗ V 映射为 δV α。因此可以得到如下结论:定义 Rα βµν := Γα βν,µ − Γα βµ,ν + Γα σµ Γσ βν − Γα σν Γσ βµ , (6.63) Rα βµν 是 ( 1 3 ) 张量的分量,这个张量把 ˜ ωα, ⃗ V , δa⃗ eµ , δb⃗ eν 映射为 δV α——也就是向量 ⃗ V 绕着 闭合路径 δa⃗ eµ , δb⃗ eν 平行移动一周的 α 分量变化量。这个张量称为 Riemann 曲率张量,记作 R。 2 R 在一点 P 的局域惯性系的分量十分有用,在 P 点有 Γα µν = 0,根据方程(6.32),Christoffel 符号的导数为: Γα µν,σ = 1 2 gαβ(gβµ,νσ + gβν,µσ − gµν,βσ ). (6.64) 2如同前面的某些量那样,Riemann 张量的没有统一的定义,甚至有些定义的指标位置都不同。在阅读文献之前要先搞 清楚文献所用的 Riemann 张量定义。
  105. D raft T ranslation 100 CHAPTER 6. 弯曲流形 gαβ 的二阶导数不全为零,因此在

    P 点有 Rα βµν = 1 2 gασ(gσβ,νµ + gσν,βµ − gβν,σµ − gσβ,µν − gσµ,βν + gβµ,σν ). (6.65) gαβ 是对称的,并且偏导数的求导次序也是对称的: gαβ,µν = gαβ,νµ (6.66) 综上可得,Riemann 张量的分量在 P 点的值为 Rα βµν = 1 2 gασ(gσν,βµ − gσµ,βν + gβµ,σν − gβν,σµ ). (6.67) 将上标 α 降为下指标可得(下式只在局域惯性系的原点 P 成立) : Rαβµν := gαλ Rλ βµν = 1 2 (gαν,βµ − gαµ,βν + gβµ,αν − gβν,αµ ). (6.68) 根据上式可以证明如下恒等式: Rαβµν = −Rβαµν = −Rαβνµ = Rµναβ , (6.69) Rαβµν + Rανβµ + Rαµνβ = 0. (6.70) 也就是说, Rαβµν 的前两个指标反对称, 后两个指标也反对称, 并且前一对与后一对指标对称。 方程(6.69)和(6.70)是张量等式,在所有坐标系都成立。注意,(6.67)式不是张量等式,因为它含有 偏导数而不是协变导数。(6.67)式只在它被导出的坐标系——局域惯性系成立。 可以证明(作为习题本章习题 18) ,方程(6.69)和(6.70)蕴含的指标对称性使得 Rαβµν (因此 Rα βµν 也一样)的独立分量的个数为 20 个(在每个指标有 4 个取值 0, 1, 2, 3 的条件下) 。这并非 巧合,6.2推导过,gαβ,µν 不能被坐标变换消去的独立变量个数也是 20 个,因此 Rα βµν 是表征曲 率的张量。 平直流形可以定义全局平行:向量沿任意闭合路径平移回到原来位置之后不变。这意味着 Rα βµν = 0 ⇔ 平直流形。 (6.71) (读者可以试试在欧几里得空间的极坐标系验证上式)
  106. D raft T ranslation 6.5. 曲率张量 101 曲率张量的一个重要应用是对向量场 ⃗ V

    求两次协变导数的时候。6.3节证明了 1 阶导数与平直 空间的情况相似,因为可以找到度规在一阶上是平直的坐标系。但是第二次求导就不同了: ∇α ∇β V µ =∇α (V µ ;β ) =(V µ ;β ),α + Γµ σα V σ ;β − Γσ βα V µ ;σ (6.72) 在局域惯性系中的 P 点,所有的 Γ 等于零,但是它的一阶导数非零。因此在 P 点: ∇α ∇β V µ = V µ ,βα + Γµ νβ,α V ν. (6.73) 切记,上式只在这个被选召的局域惯性系当中才成立,下面的(6.74)-(6.76)式也是如此。在局域惯 性系可以简化计算,交换(6.73)式的指标 α, β 可得: ∇β ∇α V µ = V µ ,αβ + Γµ να,β V ν. (6.74) 以上两式相减的结果定义为协变导数算符 ∇a 和 ∇β 的对易子 (commutator),与量子力学中的 记号相同: [∇α , ∇β ]V µ :=∇α ∇β V µ − ∇β ∇α V µ =(Γµ νβ,α − Γµ να,β )V ν. (6.75) 其中消去了关于 V µ 偏导数的两项,因为偏导数的求导顺序可以改变: V µ ,αβ = V µ ,βα . (6.76) 有必要在这里多说几句。注意 V µ ,α 是向量分量 V µ 的偏导数,根据微积分可知偏导数对易。另一 方面,∇α V µ 是张量 ∇⃗ V 的分量,而 ∇α ∇β V µ 是 ∇∇⃗ V 的分量:没有理由认为 α, β 是对称的。 上面已经证明了(6.75)式非零,两次协变导数的指标一般是不对称的。 在局域惯性系中(P 点的 Γµ αβ = 0) ,根据方程(6.75)和(6.63)可得: [∇α , ∇β ]V µ = Rµ ναβ V ν 在 P 点。 (6.77) 这是个张量方程,在任意坐标系都成立,它意味着 Riemann 张量给出了协变导数算符的对易 子。由于上式是方便的张量等式,因此它的结论并不局限于局域惯性系。因此在弯曲时空中,协变 导数的顺序必须小心处理,因为协变导数之间是不对易的。上式可以拓展到高阶张量,例如 ( 1 1 ) 张 量: [∇α , ∇β ]Fµ ν = Rµ σαβ Fσ ν + R σ ν αβ Fν σ . (6.78) 上式中每个指标都分配了一个 Riemann 张量,每一项都是正号。 (它们的符号必须相同,因为根据
  107. D raft T ranslation 102 CHAPTER 6. 弯曲流形 ∇g =

    0 可以得出结论:用 g 升降指标不受 ∇α 的影响。 ) 方程(6.77)与导出 Riemann 张量的方式——绕闭合路径平行移动——联系密切,因为它可以 看作先计算 ⃗ V 沿一个方向的变化,再计算另一方向,然后减去相反变化顺序的计算结果:这就是 协变导数的对易式。 测地偏移 前面常说,弯曲空间中最初平行的线延伸下去不会保持平行,这可以用 Riemann 张量定量表 述。考虑两条切向量分别为 ⃗ V , ⃗ V ′ 的测地线,设它们在某一初始点平行且接近,如图6.3所示,起始 点为图中的 A, A′ 点。测地线的仿射参数记作 λ,定义“connecting 向量”⃗ ξ 为从一条测地线到另一 条线的向量,其始末两点对应于两条测地线参数 λ 相等的两点(例如图中的 A, A′ 两点或者 B, B′ 两点) 。 图 6.3: connecting 向量 ⃗ ξ 是两条测地线上相等的曲线参数对应的两点之间的向量。 简明起见, 我们在 A 点的局域惯性系讨论问题, 并且令该局域惯性系的 x0 坐标线沿着测地线, 并且与 λ 的变化率相同 (也就是用 λ 进行坐标标度) 。由于 V α = dxα/dλ, 则在 A 点有 V α = δα 0 。 过 A 点的测地线方程为: d2xα dλ2 A = 0, (6.79) 其中利用了 A 点的 Christoffel 符号为零。A′ 点的 Christoffel 符号不为零,过 A′ 点的测地线为: d2xα dλ2 A′ + Γα 00 (A′) = 0, (6.80) 其中对坐标系进行安排使得 A′ 点的坐标满足 V α = δα 0 。因为 A 与 A′ 点之间的向量为 ⃗ ξ,从而有 Γα 00 (A′) ≈ Γα 00,β ξβ, (6.81) 其中等号右侧的项在 A 点取值。结合(6.80)式可得 d2xα dλ2 A′ = −Γα 00,β ξβ. (6.82) 注意,差值 xα(λ, 测地线 ⃗ V ′) − xα(λ, 测地线 ⃗ V ) 就是向量 ⃗ ξ 的分量 ξα,因此在 A 点有 d2ξα dλ2 = d2xα dλ2 A′ − d2xα dλ2 A = −Γα 00,β ξβ. (6.83) 上式描述了 ⃗ ξ 的分量是如何变化的。由于坐标系还有一定程度的任意性,因此不仅是二阶导数,我
  108. D raft T ranslation 6.6. BIANCHI 恒等式:RICCI 张量与 EINSTEIN 张量

    103 们希望计算二阶协变导数 ∇⃗ V ∇⃗ V ⃗ ξ,利用方程(6.48)可得 ∇⃗ V ∇⃗ V ξα =∇⃗ V (∇⃗ V ξα) = d dλ (∇⃗ V ξα) = Γα β0 (∇⃗ V ξβ). (6.84) 利用 Γα βγ A = 0 可得 ∇⃗ V ∇⃗ V ξα = d dλ ( d dλ ξα + Γα β0 ξβ ) + 0 = d2 dλ2 ξα + Γα β0,0 ξβ 在 A 点。 (6.85) (上式还用到了测地线平行条件 ξβ ,0 A = 0。 )我们得到 ∇⃗ V ∇⃗ V ξα =(Γα β0,0 − Γα 00,β )ξβ =Rα 00β ξβ = Rα µνβ V µV νξβ, (6.86) 其中第二个等号来自(6.63)式。最后一个等号是不依赖于坐标系的,而 A 点是任意点,因此在任意 坐标系中; ∇⃗ V ∇⃗ V ξα = Rα µνβ V µV νξβ. (6.87) 平直空间中的两条测地线保持它们的间距不变,而在弯曲空间并非如此。上式称为“测地线偏 移方程 (the equation of geodesic deviation)” ,它是引力场潮汐力 (tidal forces)(它使得相近的粒子 最终分散)的数学描述,意味着潮汐力可以由时空曲率表示,自由粒子沿时空的测地线运动。 6.6 Bianchi 恒等式:Ricci 张量与 Einstein 张量 回到 Riemann 张量分量的表达式(6.63)式。在局域惯性系中计算它对 xλ 的偏导数(普通导 数) : Rαβµν,λ = 1 2 (gαν,βµλ − gαµ,βνλ + gβµ,ανλ − gβν,αµλ ). (6.88) 从这个方程出发,再结合 gαβ = gβα 以及偏导数求导次序的对称性,可以证明: Rαβµν,λ + Rαβλµ,ν + Rαβνλ,µ = 0. (6.89) 由于在局域惯性系中 Γµ αβ P = 0,因此上式可以导出:
  109. D raft T ranslation 104 CHAPTER 6. 弯曲流形 Rαβµν;λ +

    Rαβλµ;ν + Rαβνλ;µ = 0. (6.90) 上式是在任意坐标系都成立的张量方程,它称为 Bianchi 恒等式,其地位十分重要。 Ricci 张量 在研究 Bianchi 恒等式有什么结论之前,需要先定义 Ricci 张量 Rαβ : Rαβ := Rµ αµβ = Rβα . (6.91) 其中对 Rµ ανβ 的一、三指标进行了缩并。其它缩并——一二、一四缩并也是可以的,但是由 于 Rαβµν 对前两个指标 αβ 和后两个指标 µν 都是反对称的,因此这两种缩并要么等于零,要么 就等于 ±Rαβ 。因此 Ricci 张量实际上是 Riemann 张量唯一的缩并。根据方程(6.69)可以导出 Rαβ 是对称张量(作为本章习题 25) 。 类似地,Ricci 标量定义为: R := gµνRµν = gµνgαβRαµβν . (6.92) Einstein 张量 对 Bianchi 恒等式(6.90)进行 Ricci 张量那样的缩并: gαµ[Rαβµν;λ + Rαβλµ;ν + Rαβνλ;µ ] = 0. 上式整理成: Rβν;λ + (−Rβλ;ν ) + Rµ βνλ;µ = 0. (6.93) 为了导出上式,需要利用两个结论。第一,根据(6.31)式可得 gαβ;µ = 0. 因为 gαµ 只是 gαβ 的函数,因此 gαβ ;µ = 0. (6.94)
  110. D raft T ranslation 6.6. BIANCHI 恒等式:RICCI 张量与 EINSTEIN 张量

    105 因此,gαµ 和 gβν 可以随意提出或放入协变导数当中,指标升降与协变导数运算是对易的。 第二, gαµRαβλµ;ν = −gαµRαβµλ;ν = −Rβλ;ν , (6.95) 这是(6.93)式等号右侧第二项的来历。 (6.93)式称为缩并的 Bianchi 恒等式,其更有用的形式是指标 β, ν 再进行缩并: gβν[Rβν;λ − Rβλ;ν + Rµ βνλ;µ ] = 0, 上式整理成 R;λ − Rµ λ;µ + (−Rµ λ;µ ) = 0. (6.96) 其中最后一项的负号也来自于 Riemann 张量 R 的反对称性。注意 R 是个标量,在任意坐标系中 R;λ = R,λ 。(6.96)式可以化为 (2Rµ λ − δµ λ R);µ = 0. (6.97) 上式称为二次缩并的 Bianchi 恒等式,有时也称为 Bianchi 恒等式。定义对称张量 Gαβ ≡ Rαβ − 1 2 gαβR = Gβα, (6.98) 则(6.97)式化为 Gαβ ;β = 0. (6.99) 张量 Gαβ 是由 Riemann 张量和度规构造而来的, 它的散度天生为零。它的名字是 Einstein 张 量,伟大的 Einstein 首先发现了它在引力中的重要地位。 后面会看到,GR 的 Einstein 场方程是: Gαβ = 8πTαβ, 其中 Tαβ 是能量-动量张量。于是 Bianchi 恒等式可以导出 Tαβ ;β ≡ 0,
  111. D raft T ranslation 106 CHAPTER 6. 弯曲流形 这就是局域的能量动量守恒方程。But this

    is looking a bit far ahead. 6.7 Curvature in perspective 处理曲率的数学工具复杂的令人生畏。本章有很多重要的方程,但是不需要完全记住它们,重 要的是理解推导过程,更重要的是清楚它们的几何意义。其几何意义要在下面几章详细论述,不过 本章的内容就给出了一些数学公式的意义。下面来总结弯曲空间的重要特征: 1. 我们在 Riemann 流形——定义了度规的光滑空间——当中讨论问题。 2. 度规的号差为 +2,在流形中的任一点,总存在一个坐标系使得: gαβ =ηαβ , gαβ,γ =0 ⇒ Γα βγ = 0. 3. 固有体积元是 |g|1/2 d4x, 其中 g 是度规分量矩阵 gαβ 的行列式。 4. 在局域惯性系中,协变导数等于普通导数(偏导数) 。由于曲率的存在 (Γα βγ,σ ̸= 0),协变导 数之间不对易。 5. 向量沿曲线平行移动的定义是,向量沿着曲线的协变导数为零。测地线是它的切向量沿它自 身平移的曲线。测地线的仿射参数可以取为自身的固有线长。 6. Riemann 张量是曲率的表征量,它等于零等价于流形是平直的。Riemann 张量有 20 个独立 分量(在每个指标有 4 个取值的情况下) ,它满足 Bianchi 恒等式(是个微分方程) 。在一 般的坐标系中,Riemann 张量的分量依赖于度规 gαβ 以及度规的一、二阶导数。Ricci 张量、 Ricci 标量和 Einstein 张量都来自 Riemann 张量的缩并。Einstein 张量是二阶对称张量,因 此有 10 个独立分量,这些分量满足 4 个微分方程恒等式(6.99)。 6.8 扩展阅读 微分流形的理论在大量教材中讲述。如下教材适合深入学习,并且着眼于微分流形的物理应 用, 特别是相对论:Abraham and Marsden (1978), Bishop and Goldberg (1981), Hermann (1968), Isham (1999), Lovelock and Rund (1990), and Schutz (1980b). 正统的数学教材有 Kobayashi and Nomizu (1963, 1969), Schouten (1990), and Spivak (1979). 6.9 习题
  112. D raft T ranslation Chapter 7 弯曲时空中的物理学 7.1 微分几何与引力理论的对应 将物理理论用数学形式表达,本质上是将数学概念与可观测物理量联系起来。因此我们首先要

    把之前建立的几何概念与现实世界的引力进行对应,这之前已经多少讨论过了,例如我们假设时空 是个微分流形,并且已经证明了在非均匀引力场下不存在全局惯性系,在这些论述之后是如下的两 条对应: (I) 时空(所有事件的集合)是带有度规的四维流形。 (II) 度规可以由杆与钟测量。 用杆测量的相邻两事件点 (它们的时间相同) 的空间间距是 |d⃗ x·d⃗ x|1/2, 用钟测量的时间相近的两事件点(它们的空间位置相同)的时间间隔是 | − d⃗ x · d⃗ x|1/2。 一般不存在一个坐标系使得 d⃗ x · d⃗ x = −(dx0)2 + (dx1)2 + (dx2)2 + (dx3)2 处处成立。另一方 面,我们论证了这种坐标系在局域上是存在的。这显然对应着弯曲流形,在其中任一点附近都存在 坐标系局域的与 Minkowski 时空相似(例如向量的点乘形式) 。 据此可以进行如下的对应条件: (III) 在任一事件点附近,存在合适的坐标系使得时空的度规为 Lorentz 形式 ηαβ 。 在钦定了这种表示时空的方式之后,还需要完成两点才能得到完整的理论。第一,必须说明物 理对象(粒子、电场、流体等等)在弯曲时空中如何表现;第二,必须说明时空中的物体是怎样产 生或着决定曲率的。 作为物理理论的例子,我们先来考虑牛顿引力理论。牛顿理论的时空是三维欧几里得空间加上 一维时间轴(数学上的记号是 R3 × R) 。不存在整体时空流形上的度规,空间距离来自欧几里得空 间自带的普通度规、时间由绝对的“宇宙钟”测量。速度不同的观测者地位相同:这是伽利略力学里 的相对性。因此不存在绝对静止的参照物,并且不同观者对于两个不同时的事件是否发生于同一地 点的结论可能不同。但是所有观者的同时性——即两个事件是否在同一时间(时间轴的同一切片) 发生——是绝对的,所以两个事件的“时间间隔”意味着包含两个事件的欧几里得切面之间经过的时 间。它与事件的空间位置无关,因此牛顿引力理论中的时间是绝对的:所有观者,无论位置或运动 状态如何,观测到的两事件的时间间隔都相同。类似地,两事件的“空间间隔”的含义是两事件在欧 107
  113. D raft T ranslation 108 CHAPTER 7. 弯曲时空中的物理学 几里得空间的距离。如果两个时间是同时的(发生于时间轴的同一欧几里得切片) ,则利用那个切

    片的空间度规即可计算空间间隔,所有观测者的结果相同。如果两个事件发生的时间不同,则每个 观者取他所观测到的事件的切片并计算空间间隔,不同观者观测到的事件的坐标不同,但距离都相 同。 然而,在牛顿理论中无法将时间与距离观测结合起来:there was no invariant measure of the length of a general curve that changed position and time as it went along. 没有将时间与空间距离 相互转换的不变量,也就无法进行结合。爱因斯坦为相对论引入了不变量——光速,它将空间与时 间的观测量统一起来。爱因斯坦四维时空的结构实际上比牛顿的绝对时空更加简单! 在绝对时空的模型下,牛顿给出了描述物体受引力影响的定律:F = −ma,其中 F = −m∇ϕ 是物体在给定引力场 ϕ 当中所受的引力。 牛顿也给出了物体是如何产生引力场 ϕ 的:∇2ϕ = 4πGρ。 时空的相对论描述必须给出这两个定律的对应版本,第二个式子的对应在下一章讨论,本章研究一 个给定的度规是如何影响时空中的物体的。 之前讨论过粒子运动的简单情况。我们知道粒子在引力场中的“加速度”与粒子质量无关,因此 在附近的自由下落参考系中粒子加速度为零,这就对应于局域惯性系。因为自由下落粒子在该系的 加速度为零,因此粒子(至少是局域地)沿直线运动。局域惯性系的直线正是弯曲流形的测地线的 定义。这样我们得到了关于粒子受度规影响的第一条假设:1 (IV) 弱等效原理 (Weak Equivalence Principle, WEP):自由下落粒子沿时空的类时测地线 运动。 “自由下落”意味着粒子不受其它力影响, 例如电场力等等。 其它所有的力与引力的区别在于, 存 在着不受其它力作用的粒子。因此弱等效原理 (假设 IV) 是很强的陈述, 它可以被实验检验。WEP 饱经、并且一直在经受高精度的检验,其中典型的实验例如比较由不同材料组成的物体的下落速 度;当前的对加速度差别的实验限制已经到了 1013 量级 (Will 2006)。因此 WEP 是被实验验证的 精度最高的物理定律之一。人们计划利用卫星搭载的实验来将精度提高到 10−18 量级。 不过,WEP 只针对粒子,其它对象(例如流体)是如何受非平直度规影响的?为此需要将 IV 进行推广: (IV)′ 爱因斯坦等效原理 (Einstein Equivalence Principle, EEP):任何不涉及引力的、局域 的物理实验,在(弯曲时空中的)自由下落惯性系的结果与在平直时空(狭义相对论有效)中 的结果相同。 其中, “局域”的含义是实验不涉及场,例如电场,场延伸到一大片时空区域,超出了局域惯性 系的有效范围。所有的局域物理结果在自由下落惯性系的结果,与狭义相对论的结果相同。引力局 域上没有引入任何新内容,所有引力的效应要在时空中延伸一定的区域才能感受到,这也被实验严 格检验过了 (Will 2006)。 (未完成) This may seem strange to someone used to blaming gravity for making it hard to climb stairs or mountains, or even to get out of bed! But these local effects of gravity are, in Einstein’s point 1WEP 更普遍的定义没有涉及弯曲时空,而只是说粒子在引力场的下落速度相同(不依赖于粒子质量与位置) 。但是爱 因斯坦等效原理(假设 IV′ 意味着引力可以由时空曲率表示,因此我们以弯曲时空作为讨论的出发点。
  114. D raft T ranslation 7.1. 微分几何与引力理论的对应 109 of view, really

    the effects of our being pushed around by the Earth and objects on it. Our ‘weight’ is caused by the solid Earth exerting forces on us that prevent us from falling freely on a geodesic (weightlessly, through the floor). This is a very reasonable point of view. Consider astronauts or- biting the Earth. At an altitude of some 300 km, they are hardly any further from the center of the Earth than we are, so the strength of the Newtonian gravitational force on them is almost the same as on us. But they are weightless, as long as their orbit prevents them encountering the solid Earth. Once we acknowledge that spacetime has natural curves, the geodesics, and that when we fall on them we are in freefallandfeelnogravity,thenwecandisposeoftheNewtonianconceptofagravitational force altogether. We are only following the natural spacetime curve. The true measure of gravity on the Earth are its tides. These are nonlocal effects, because they arise from the difference of the Moon’s Newtonian gravitational acceleration across the Earth, or in other words from the geodesic deviation near the Earth. If the Earth were permanently cloudy, an Earthling would not know about the Moon from its overall grav- itational acceleration, since the Earth falls freely: we don’t feel the Moon locally. But Earthlings could in principle discover the Moon even without seeing it, by observing and understanding the tides. Tidal forces are the only measurable aspect of gravity. 爱因斯坦等效原理数学上的含义是(粗略地说) ,如果一条局域的物理定律在 SR 中写成了张 量方程,则该定律在弯曲时空的局域惯性系中的数学形式也是如此。 这一原理经常被称作“逗号变分号规则” ,因为如果定律的 SR 形式含有导数(逗号) ,则它在局 域惯性系中也是如此。为了让方程在任意坐标系都有效,只需要在局域惯性系中把普通导数换成协 变导数(分号) ,2 这是一种超级简单地推广物理定律的方式。特别地,这一原理禁止了“曲率耦合” : 例如热力学在弯曲时空的真正形式可能含有 Riemann 张量,而在 SR 中 Riemann 张量的相关内 容会消失不见。假设 (IV)′ 不允许 Riemann 张量有关的项出现在方程中。 下面举例说明怎样将 ((IV)′) 转换为数学形式, 以流体动力学 (它是本课程的主要研究对象) 为 例。SR 中的粒子数守恒定律表示为 (nUα),α = 0, (7.1) 其中 n 是瞬时共动参考系 (MCRF) 的粒子数密度,而 Uα 是流体元的四速。在弯曲时空中的任意 事件处,可以可以找到与该事件处的流体元瞬时共动的局域惯性系,并且按类似的方式定义 n,同 样,可以像 SR 那样定义四速 ⃗ U 是那个坐标系的时间基向量。于是,根据爱因斯坦等效原理,粒 子数守恒律在局域惯性系的形式正是(7.1)式。由于 Christoffel 符号在给定事件点(该点是局域惯 性系的原点)处等于零,(7.1)式等价于 (nUα);α = 0. (7.2) 这种张量方程的形式在任何坐标系都成立,从而利用上式就可以在任意坐标系中计算粒子数守恒, 还要记住上式源于爱因斯坦等效原理。 这样,我们将粒子数守恒律推广到了弯曲时空。在之后需要的场合,我们总是利用这种方法推 广物理定律。 2当然,这样做的理由是 Christoffel 符号在局域惯性系的原点处等于零,前面用过很多次了。 ——译者
  115. D raft T ranslation 110 CHAPTER 7. 弯曲时空中的物理学 上述内容仅仅是张量的游戏, 还是蕴含着新的物理意义?弯曲时空中的粒子守恒律可能是(7.2)以

    外的形式吗?有可能。考虑如下形式: (nUα);α = qR2, (7.3) 其中 R 是 Ricci 标量,定义在(6.92)式,它是 Riemann 张量的两次缩并;q 是常数。由于平直时空 的 Riemann 张量为零,因此上式也会退化到 SR 形式(7.1)式。但是在弯曲时空中,上式预言的内 容完全不同:曲率可以产生或湮灭粒子(与 q 的符号有关) 。上两式都和 SR 的形式相符。爱因斯 坦等效原理断言,应该把(7.1)式推广为尽量简单的形式,也就是(7.2)。当然,决定(7.2)和(7.3)式哪 个正确要靠实验或者天文观测。本书采用绝大多数的观点——爱因斯坦等效原理是正确的。没有什 么观测性证据反对它。 类似地,SR 中的熵守恒定律是 UαS,α = 0. (7.4) 因为标量 S 的协变导数不含 Christoffel 符号,所以上式在弯曲时空的形式不变。 最后,四动量守恒定律为 Tµν ,ν = 0. (7.5) 推广到弯曲时空的形式为 Tµν ;ν = 0. (7.6) 其中能动张量的定义与之前相似: Tµν = (ρ + p)UµUν + pgµν. (7.7) (注意,gµν 在局域惯性系等于平直时空度规 ηµν.) 7.2 轻微弯曲时空的物理学 为了研究爱因斯坦等效原理 ((IV)′) 对粒子或流体运动的影响, 我们必须知道时空流形的度规。 由于还没讲度规是如何产生的,因此目前必须钦点一个在之后推导的度规作为出发点。之后会看 到,弱引力场(用牛顿理论的话来说,就是粒子的引力势能远小于粒子的静质能)的度规完全由牛 顿引力势 ϕ 所确定,其形式为 ds2 = −(1 + 2ϕ)2dt2 + (1 − 2ϕ)(dx2 + dy2 + dz2). (7.8) (ϕ 的值小于零,从而在距离质点 M 很远的地方有 ϕ = −GM/r.)注意弱引力场的条件意味
  116. D raft T ranslation 7.2. 轻微弯曲时空的物理学 111 着 |mϕ| ≪

    m,即 |ϕ| ≪ 1。度规(7.8)式实际上只是精确到 ϕ 的一阶量,因此之后的推导也只保留 到 ϕ 的一阶量,而略去二阶及以上小量。 下面计算自由下落粒子的运动情况。粒子的四动量记作 ⃗ p,它等于 m⃗ U(除了无质量粒子) ,其 中 ⃗ U = d⃗ x/dτ。根据弱等效原理 ((IV)),自由粒子的轨迹是测地线,我们知道粒子的固有时是测 地线的一种仿射参量。因此 ⃗ U 必须满足测地线方程: ∇⃗ U ⃗ U = 0. (7.9) 便利起见,注意到固有时的常数倍 τ/m 也是测地线的仿射参量,于是 d⃗ x/d(τ/m) 也是满足测地线 方程的向量,这个向量就是 md⃗ x/dτ = ⃗ p。因此自由粒子的运动方程可以写为 ∇⃗ p ⃗ p = 0. (7.10) 这个方程也能用于光子,尽管光子的 ⃗ p 定义良好,但是由于 m = 0 所以 ⃗ U 没有定义。 设粒子在(7.8)式的坐标系中的速度是非相对论性的,下面来计算(7.10)式的非相对论近似。首 先考虑方程的 0 分量,注意沿 ⃗ p 的普通导数等于 m 乘以沿 ⃗ U 的普通导数,即 md/dτ: m d dτ p0 + Γ0 αβ pαpβ = 0. (7.11) 粒子的速度是非相对论性的,即 p0 ≫ p1,于是(7.11)式近似为 m d dτ p0 + Γ0 00 (p0)2 = 0. (7.12) 下面计算 Γ0 00 : Γ0 00 = 1 2 g0α(gα0,0 + gα0,0 − g00,α ). (7.13) 由于矩阵 [gαβ ] 是对角的, 因此它的逆矩阵 [gαβ] 也是对角的, 逆矩阵元等于相应对角元的倒数。因 此 g0α 的非零元只有 α = 0,于是(7.13)式化为 Γ0 00 = 1 2 g00g00,0 = 1 2 1 −(1 + 2ϕ) (−2ϕ),0 = ϕ,0 + 0(ϕ2). (7.14) 可见 Γ0 00 为 ϕ 的一阶量,因此(7.12)式中与 Γ0 00 相乘的 (p0)2 只需保留 ϕ 的零阶量——m2,这 样(7.12)式化为 d dτ p0 = −m ∂ϕ ∂τ . (7.15) 由于 p0 即为粒子在该坐标系的能量,因此上式意味着如果引力场不随时间变化,则自由粒子的能 量守恒。这个结论在牛顿理论中也成立。然而,必须注意 p0 只是粒子相对于该坐标系的能量。 测地线的空间分量对应于牛顿理论的 F = ma: pαpi ,α + Γi αβ pαpβ = 0, (7.16)
  117. D raft T ranslation 112 CHAPTER 7. 弯曲时空中的物理学 在 Γ

    的求和中利用非相对论性近似 p0 ≫ p1 将上式化为 m dpi dτ + Γi 00 (p0)2 = 0. (7.17) 仍然利用近似 (p0)2 = m2 带入得到 画外音:其实应该先算 Christoffle 符号 Γi 00 确定它是一阶小 量,才敢把与它相乘的 (p0)2 只保留零阶项 dpi dτ = −mΓi 00 . (7.18) 下面计算 Christoffel 符号: Γi 00 = 1 2 giα(gα0,0 + gα0,0 − g00,α ). (7.19) 由于 [gαβ] 是对角矩阵,因此它的逆矩阵为 giα = (1 − 2ϕ)−1δiα, (7.20) 由此可得 Γi 00 = 1 2 (1 − 2ϕ)−1δij(2gj0,0 − g00,j ), (7.21) 其中已经把 α 换成了 j,因为 δi0 等于零。注意到 gj0 ≡ 0,由此可得 Γi 00 = − 1 2 g00,j δij + 0(ϕ2) (7.22) = − 1 2 (−2ϕ),j δij (7.23) 这样,运动方程(7.17)化为 dpi dτ = −mϕ,j δij. (7.24) 牛顿理论的引力为 −m∇ϕ,可见上式与牛顿理论一致。因此在高阶效应很小观测不到的情况 下,广义相对论对行星轨道的预言仍然是开普勒观测的那样,后面会看到对大部分行星都是如此, 除了水星,它的高阶效应可以观测到。 上面的能量守恒方程与运动方程都源于两个近似:度规近似为 Minkowski 度规 (|ϕ| ≪ 1),粒 子的速度是非相对论性的 (p0 ≫ pi)。这两个限制正是牛顿理论的适用范围,这就确保了我们重新 导出牛顿方程。然而这不是有什么魔法,必须回到牛顿方程,因为我们知道自由粒子在自由下落参 考系中沿直线运动。 对于其它系统,可以进行类似的计算以证明在合适的近似下回到牛顿理论。例如,本章习题 5 是关于理想流体的例子,注意流体的非相对论性不仅意味着流体的运动速度很小,而且流体粒子的 随机运动(热运动)速度也是非相对论的,这意味着 p ≪ ρ。
  118. D raft T ranslation 7.3. CURVED INTUITION 113 相对论与旧的牛顿理论的这种在合适极限下的对应关系相当重要。任何新理论必须在旧理论 适用的范围内与旧理论一致。等效原理加上(7.8)式的度规做到了这一点。

    7.3 Curved intuition 尽管在合适的极限下,弯曲时空与牛顿理论的预言结果相同,但是它们在概念上差别很大,必 须逐渐理解新理论的观点。 第一个差别在于是否有优越的坐标系。牛顿理论以及 SR 中,惯性系是优越的。由于“速度”不 能被局域测量但是“加速度”可以,这两个理论选出了一组特殊的时空坐标系,粒子在其中既没有物 理加速度(即 d⃗ U/dτ = 0)也没有坐标加速度(d2xi/dt2 = 0) 。在新理论中,全局惯性系(即任意 d⃗ U/dτ = 0 的粒子都满足 d2xi/dt2 = 0 的坐标系)不存在,因此所有坐标系平权。利用 Christoffel 符号可以从 d2xi/dt2 这样坐标依赖的量得到 d⃗ U/dτ 这样不依赖坐标系的量。因此我们不需要也 不应该建立坐标依赖的思维方式。 第二个差别在于能量和动量。在牛顿理论、SR 与新的几何引力理论中,每个粒子都有确定的 能量与动量,而它们的值依赖于在哪个坐标系计算。在后两个理论中,能量动量是同一个四维向量 ⃗ p 的分量。在 SR 中,系统总的四维动量是系统所有粒子的四动量之和 ∑ i ⃗ p(i) 。但是在弯曲时空 中,定义在不同点的向量不能简单地相加,因为不知道怎么加:两个向量只有在同一点进行比较才 能判断是否平行, 而向量从一点平移到另一点的值取决于沿哪条曲线平移, 因此不存在将所有 ⃗ p 相 加的不变的方式,即使一个系统有确定的四动量,事情也不会像 SR 那样容易。 可以发现,在空间上有界的系统(即孤立系统)的总能量与总动量可以定义,其定义方式之后 讨论。系统的总质能不等于每个粒子的能量之和,这可以通过牛顿理论的情况看出:各粒子之间存 在着自引力势能(引力自能) ,它是负的量,等于将组成系统的粒子从彼此相距无穷远移动到组成 系统的过程中所得到的功。要将这种能量考虑在内,就不能只计算单个粒子,还要考虑时空几何。 然而,引力势能的概念本身没有在新理论的图样中良好定义:它某种意味上表示了粒子能量之和 与系统总质能的差值,但是由于粒子的能量之和没有良好定义,引力势能也没有。一般来说,只有 系统总的能量-动量和单个粒子的四动量是可定义的。 7.4 守恒量 前面关于能量的讨论让人想要研究一个粒子或系统的守恒量。对于粒子,必须意识到引力在旧 观点中是一个“力”,因此粒子在引力作用下动能、势能不守恒。相应的,在新观点下,不会有哪个 坐标系使得 ⃗ p 在其中的分量沿着粒子轨迹不变。存在一种值得注意的例外,它十分重要,值得详细 讨论。 将测地线方程的 ⃗ p 的上指标“降低” : pαpβ;α = 0, (7.25) 将协变导数展开: pαpβ,α − Γγ βα pαpγ = 0,
  119. D raft T ranslation 114 CHAPTER 7. 弯曲时空中的物理学 移项得 m

    dpβ dτ = Γγ βα pαpγ . (7.26) 等号右侧的项可以简化: Γγ αβ pαpγ = 1 2 gγν(gνβ,α + gνα,β − gαβ,ν )pαpγ = 1 2 (gνβ,α + gνα,β − gαβ,ν )gγνpγ pα = 1 2 (gνβ,α + gνα,β − gαβ,ν )pνpα. (7.27) pνpα 的 να 指标对称,而上式括号中的第一、三项 (gνβ,α − gαβ,ν ) 的 να 指标反称,对称张量与反 称张量缩并结果为零,这样只余下中间一项: Γγ βα pαpγ = 1 2 gνα,β pνpα. (7.28) 因此,不失一般性,测地线方程化为 m dpβ dτ = 1 2 gνα,β pνpα. (7.29) 由此可得如下重要结论:如果 gαν 的所有分量与坐标 xβ(β 是给定的值)无关,则 pβ 沿着 任何自由粒子轨迹是常量。 例如,对于静态(不依赖于时间)引力场,可以找到坐标系使得其中的度规分量不依赖时间, 因此系统的 p0 守恒。于是 p0 (实际上是 −p0 )通常称为粒子的“能量” ,而不需要指出是“在该坐标 系中的”能量。注意,静态度规在某个坐标系的分量可以依赖时间,例如从“好的”坐标系进行与时间 有关的坐标变换就行了。实际上,大部分自由下落局域惯性系都是这种系,因为自由下落粒子受到 随位置变化的引力场的影响,因此该系中的度规随时间变化。度规分量为静态的坐标系是特别的, 它通常是地球上的“实验室坐标系” 。因此这个系中的 p0 与通常在实验室观测到的粒子能量有关, 它 包含了粒子的引力势能,下面就来进行论证。考虑 ⃗ p · ⃗ p = −m2 = gαβ pαpβ = −(1 + 2ϕ)(p0)2 + (1 − 2ϕ) [ (px)2 + (py)2 + (pz)2 ] , (7.30) 上式已经利用了度规 (7.8) 式,由上式可得 (p0)2 = [ m2 + (1 − 2ϕ)(p2) ] (1 + 2ϕ)−1, (7.31) 其中将 (px)2 + (py)2 + (pz)2 简记为 p2。利用近似 |ϕ| ≪ 1, |p| ≪ m,上式简化为 (p0)2 ≈ m2 ( 1 − 2ϕ + p2 m2 )
  120. D raft T ranslation 7.5. 扩展阅读 115 亦即 p0 ≈

    m ( 1 − ϕ + p2 2m2 ) . (7.32) 将指标降低: p0 = g0α pα = g00 p0 = −(1 + 2ϕ)p0, (7.33) −p0 ≈ m ( 1 + ϕ + p2 2m2 ) = m + mϕ + p2 2m . (7.34) 右侧第一项是粒子的静质能,第二、三项分别是牛顿形式的引力势能和动能。可见,p0 沿粒子 轨迹守恒是牛顿理论中能量守恒的推广。 注意,对于一般的引力场,不存在坐标系使得其中的度规分量是静态的,3因此不能定义守恒 的能量。 类似地,如果度规具有轴对称性,即存在坐标系使得其中的度规分量 gαβ 不依赖于旋转角 ψ, 则 pψ 是守恒的,它是粒子的角动量。在非相对论极限下 pψ = gψψ pψ ≈ gψψ m dψ dt ≈ mgψψ Ω, (7.35) 其中 Ω 是粒子的角速度。对于接近平直的度规,在柱坐标系 (r, ψ, z) 中: gψψ = ⃗ eψ · ⃗ eψ ≈ r2, (7.36) 因此相应的守恒量 pψ ≈ mr2Ω. (7.37) 这就是牛顿理论的角动量。 关于粒子守恒律的讨论告一段落。流体的推导过程类似, 因为流体就是大量粒子的集合。但是, 自引力系统的总质量与总动量的情况仍然十分复杂。后面会看到,孤立系统的质量与动量守恒,但 这必须在对这些量下定义之后才能继续讨论。 7.5 扩展阅读 Geroch (1978) 详细讨论了曲率与物理学是怎样结合的。所有的广义相对论的高阶教材都深 入探讨了守恒量。本章内容是不变的弯曲时空中量子场论的基础,参见 Birrell and Davies (1984) and Wald (1994). 它是目前引力研究最活跃的前沿之一——广义相对论的量子化。本书并未涉及 3这种坐标系的不存在性容易证明。4 × 4 对称度规分量矩阵有 10 个独立分量,而坐标变换(四个函数 x¯ α(xµ))只引 入了改变度规分量的四个自由度。只有特殊的度规才能通过坐标变换将所有分量变为不依赖于时间。
  121. D raft T ranslation Chapter 8 爱因斯坦场方程 8.1 场方程的 Purpose

    and justification 引力及其对物质的影响是用带度规的弯曲流形描述的,为了建立完整的理论,必须给出引力场 源确定度规的定律。牛顿理论中的相应定律是 ∇2ϕ = 4πGρ, (8.1) 其中 ρ 是质量密度。质点 m 对应的解为(见本章习题 1) ϕ = − Gm r , (8.2) 在 c = 1 的单位制下,ϕ 是无量纲的。 牛顿理论的引力场源是质量密度,引力的相对论性理论必须包含它, “质量”本身不是相对论性 的概念,因此要考虑其它量。一个显然的推广是含有静质量的总能量。第4章把在流体元的 MCRF 中流体元的总能量密度记作 ρ,ρ 作为相对论性引力场源好不好啊?不太好,因为 ρ 只是 MCRF 一种参考系观测到的能量密度,其他观测者在他们自己的参考系观测的能量密度是分量 T00。如果 ρ 是场源,则意味着有一组更优越的参考系(他们的能量密度是 ρ,而其他的只能叫 T00) 。前面强 调过所有参考系平权,因此这种看法不行,ρ 不能作为场源,牛顿理论的质量密度在相对论的推广 应该是 T00。 不过,如果只有 T00 是引力场源,那么总得选一个坐标系以计算 T00。要构造一个具有不变性 的、不偏爱任何坐标系的理论,只有把整个应力-能量张量 T 作为引力场源。(8.1)式推广到相对论 的形式为 O(g) = kT, (8.3) 其中 k 是待定常数,O 是作用于 g 的微分算符,方程(7.8)已经剧透了 g 是 ϕ 的推广。(8.3)式有 10 个独立分量(并非 16 个,因为 T 是对称的) ,分别表示 10 个微分方程,而牛顿理论只有一 个(8.1)式。 类比(8.1)式可得,O 应该是二阶微分算符。由于(8.3)式中的 T 是 ( 2 0 ) 张量,因此 O 作用于 g 所得结果也应该如此。也就是说,{Oαβ} 是 ( 2 0 ) 张量的分量,由 gµν,λσ 、gµν,λ 和 gµν 组成。第6章 117
  122. D raft T ranslation 118 CHAPTER 8. 爱因斯坦场方程 推导了 Ricci

    张量 Rαβ 满足这种要求。实际上,具有如下形式的任意张量都可以: Oαβ = Rαβ + µgαβR + Λgαβ, (8.4) 其中 µ, Λ 是常数。 为了确定 µ,要用到 Tαβ 的一个尚未使用过的性质——爱因斯坦等效原理,这要求能量动量 局域守恒((7.6)式): Tαβ ;β = 0. 上式必须对所有度规张量成立,因此根据(8.3)式可得 Oαβ ;β = 0 (8.5) 也要对所有度规成立。结合 gαβ ;µ = 0,由(8.4)式可得 (Rαβ + µgαβR);β = 0. (8.6) 上式与方程(6.98)比较可得 µ = −1 2 。上面一通分析得到的方程为 Gαβ + Λgαβ = kTαβ, (8.7) 其中 Λ, k 是待定常数。上式用无指标形式写为 G + Λg = kT. (8.8) 这称为 GR 的场方程,或者叫爱因斯坦场方程。后面会看到,常数 k 可以通过退化到牛顿理 论的要求来确定,而 Λ 仍然是任取的。 现在先总结一下目前的进度。方程(8.7)是通过如下要求“导出”的: (i) 与方程(8.1)相似并且将它推广, (ii) 不涉及钦点的坐标系, (iii) 保证能量-动量的局域守恒对任意度规张量都成立。 (8.7)式不是唯一满足 (i)-(iii) 的方程。人们提出了很多其它形式,有些甚至在爱因斯坦得到(8.7)式 之前。近年来,随着技术的进步,爱因斯坦场方程可以得到高精度的验证。即使是对太阳系的弱 引力场也有着爱因斯坦的替代理论,有些理论是为了在即将进行的太阳系实验中与 GR 的结论保
  123. D raft T ranslation 8.1. 场方程的 PURPOSE AND JUSTIFICATION 119

    持一致,而在强引力场中不同。GR 的竞争理论总是比爱因斯坦场方程复杂,在美学层面上就不会 吸引大量物理学家,除非某一天发现爱因斯坦方程与实验不符。Misner et al. (1973), Will (1993), and Will (2006) 介绍了一些替代理论,以及 1960 年以来精度越来越高的实验是如何排除某些理论 的。 (第11章要讨论 GR 的两个经典实验验证。 )爱因斯坦场方程与这些检验符合的非常好,本书不 讨论 GR 的替代理论,在这一点上,我们与诺贝尔奖得主、天体物理学家 S. Chandrasekhar (1980) 的看法一致: The element of controversy and doubt, that have continued to shroud the general theory of relativity to this day, derives precisely from this fact, namely that in the formulation of his theory Einstein incorporates aesthetic criteria; and every critic feels that he is entitled to his own differing aesthetic and philosophic criteria. Let me simpy say that I do not share these doubts; and I shall leave it at that. 尽管爱因斯坦的理论目前是没有挑战的,但仍然存在证据表明 GR 并非终极理论,因此还需 要进行实验检验。爱因斯坦的理论并非量子理论,已经有大量的工作致力于建立一致的量子引力理 论。我们预计, 在某个实验精度上可以观测到 GR 的量子修正, 这可能来自与度规耦合的额外的场, 这种场的源必然违背爱因斯坦等效原理,也可能产生额外形式的引力波。原则上,GR 与量子引力 理论的任何预言都应该不同。有朝一日,高精度的引力实验会给量子引力理论提供线索。然而,尽 管它很有趣,但是这种理论超出了本书范围,本书不讨论 GR 的其它替代理论。 几何单位制 方程(8.7)中的常数 k 尚未确定,它的地位如同(8.1)式中的 4πG 一样。在确定它之前,下面先 来建立一种更简单的单位制,在其中 G = 1。前面看到,在 SR 中选择单位制使得基本常量 c = 1 带来了很多便利,在引力理论中选择 G = 1 的单位制也一样。c = G = 1 的单位制称为几何单位制 (geometrized units),它与 SI 单位制之间常用的转换因子为 1 = G c2 = 7.425 × 10−28 m kg−1. (8.9) 利用上式可以将质量单位千克 (kg) 化为长度单位米 (m)。表格 8.1 列出了一些常量在 SI 和集合单 位制的值。本章习题 2 有助于读者掌握新的单位制。 常量 SI 值 几何值 c 2.998 × 108 ms−1 1 G 6.674 × 10−11 m3kg−1s−2 1 ℏ 1.055 × 10−34 kg m2 s−1 2.612 × 10−70 m2 me 9.109 × 10−31 kg 6.764 × 10−58 m mp 1.673 × 10−27 kg 1.242 × 10−54 m M⊙ 1.988 × 1030 kg 1.476 × 103 m M⊕ 5.972 × 1024 kg 4.434 × 10−3 m L⊙ 3.84 × 1026 kg · m2 · s−3 1.06 × 10−26 表 8.1: SI 与几何单位制中基本常量的取值对比 注:符号 me 和 mp 分别代表电子和质子的静质量;M⊙ 和 M⊕ 分别代表太阳和地球的质量; L⊙ 表示太阳的光度(其 SI 单位等于焦耳每秒) 。最多保留四位有效数字(即使精度更高) ,数据 来自 Yao (2006).
  124. D raft T ranslation 120 CHAPTER 8. 爱因斯坦场方程 几何单位制在引力理论中的本质地位可以通过 M⊕

    在两种单位制的值来说明。地球的质量是 通过观测卫星轨道并利用开普勒定律得到的。它测量了牛顿引力势能——含有因子 GM⊕ ,这等于 c2 乘以质量的几何单位制的值。地球卫星轨道的激光跟踪实验的结果具有十位有效数字。由于光 速 c 具有确定的值,因此它没有不确定度,于是 M⊕ 的几何值具有十位有效数字。然而,G 的值 是在实验室测量的,引力很弱,实验的不确定度较大。The conversion factor G/c2 is uncertain by two parts in 105, so that is also the accuracy of the SI value of M⊕ 。类似地,利用行星的雷达精确 跟踪实验 (precise radar tracking of the planets) 观测的太阳质量的几何值有着 9 位有效数字,而 它用千克表示的值的不确定度却大得多。 8.2 爱因斯坦方程 爱因斯坦方程的分量形式——(8.7)式在 Λ = 0(目前采用这种简化假设,后面会重新考虑 Λ) 、 k = 8π 的情况下: Gαβ = 8πTαβ. (8.10) 常数 Λ 称为宇宙学常数 (cosmological constant),爱因斯坦最初没有引入 Λ,而是在几年后为 了得到静态宇宙解(描述宇宙大尺度行为的解)才引入,那时他对此很满意。然而之后观测到的宇 宙膨胀现象使得爱因斯坦放弃了 Λ 并后悔引入它。再然而…近年来的天文观测强烈暗示 Λ 的取值 很小但不为零。第12章讨论含 Λ 的情况,而目前设 Λ = 0。这样做的理由,以及潜在的危险性在本 章习题 18 进行讨论。 k = 8π 是通过要求爱因斯坦方程预言太阳系的行星运动与牛顿理论一致而得到的。在太阳系 的这种牛顿极限环境下,必须要求 GR 的预言与牛顿理论一致,因为后者是饱经实验检验的理论。 在本章最后一节会看到, 牛顿运动所对应的度规正是(7.8)式。本章的任务之一就是证明爱因斯坦方 程(8.10)式在弱引力场的情况下的解是(7.8)式(见本章习题 3) 。当然,讲道理的话,现在应该认为 k 是任意的,在导出(7.8)式那样的解之后再得到 k 的值,不过提前把 k 的值设为 8π 是很方便的, 只要到时候证明这个值是正确的就好。 方程(8.10)是 10 个耦合的微分方程(并非 16 个,因为 Tαβ 和 Gαβ 都是对称的) 。在给定场 源 Tαβ 之后求解度规 gαβ 的十个独立分量。这些方程是非线性的,但是它们有着良好的初值结构 ——即,在初始值给定之后 gαβ 之后的值也随之确定。然而,必须指出一点:由于 {gαβ } 是张量 在某个坐标系的分量,因此坐标变换会造成 {gαβ } 的变换,由于有 4 个坐标,于是这 10 个 gαβ 有 着 4 个任意的函数自由度。因此,根据任意初始条件确定所有的 10 个 gαβ 是不可能的,因为初始 状态以后的坐标可以任意变换。实际上,爱因斯坦方程也具有这种性质:Bianchi 恒等式 Gαβ ;β = 0 (8.11) 意味着 10 个 Gαβ 之中存在 4 个微分恒等式(分别对应 α = 0, 1, 2, 3) ,这 10 个 Gαβ 也不是独立 的,因而 10 个爱因斯坦方程中实际上只有 6 个独立方程,对于 10 个 gαβ 中的 6 个分量求解,描 述不依赖于坐标系的几何性质。 上述内容在考虑系统从某个初态开始随时间演化的时候特别重要。本书第9章将会以一种有限
  125. D raft T ranslation 8.3. 弱引力场的爱因斯坦方程 121 的方式来处理引力波。由于爱因斯坦方程很复杂,它的动力学状况通常通过数值求解。数值相对 论领域已经建立了明确的方法以将 gαβ

    的坐标自由度和真正的几何与动力学自由度区分开来。这 在更高阶的教材中有所描述,例如 Misner et al. (1973), or Hawking and Ellis (1973), see also Choquet-Bruhat and York (1980) or the more recent review by Cook (2000). 这里只需要理解实 际只有关于 gαβ 中 6 个量的 6 个方程,以及爱因斯坦方程允许完整的选择坐标系的自由度。 8.3 弱引力场的爱因斯坦方程 近 Lorentz 坐标系 没有引力的时空是平直的,弱引力场的时空是“近”平直的。 “近”平直的流形的含义是,存在坐标 系使得度规在其中的分量为 gαβ = ηαβ + hαβ , (8.12) 其中 |hαβ | ≪ 1 (8.13) 在时空的任意点成立。这种坐标系称为近 Lorentz 坐标系 (nearly Lorentz coordinates)。注意,上 述定义要求“存在坐标系”而非“对所有坐标系”,因为即使是 Minkowski 时空也可以有奇怪的坐标 系使得其中的度规分量 gαβ 并非 ηαβ 那样简单的对角矩阵 (−1, +1, +1, +1)。另一方面,如果方 程(8.12)和(8.13)式在某一坐标系成立, 则存在许多这样的坐标系。存在着两种保证近 Lorentz 坐标 系经变换后仍然是近 Lorentz 的坐标变换:背景 Lorentz 变换和规范变换。 前面既然说过爱因斯坦方程允许完整的选择坐标系的自由度、其理论预言在所有坐标系中都 相同,那么为啥要考虑这种特别的近 Lorentz 坐标系?当然,所有坐标系的计算结果相同,但是在 不合适的坐标系中的计算过程十分困难。 (例如在球坐标系求解自由下落粒子的牛顿方程,或者在 不能用分离变量法的坐标系中求解 Poisson 方程。 )也许在一个不合适的坐标系中可能求解,只是 鱼唇的人类没有足够的创造和洞察力来得到相应的预言结果。因此, 在 GR 中求解任何问题的第一 步是找到使计算最简单的坐标系。正是因为爱因斯坦方程具有完整的坐标自由度,因此我们才可以 机智地利用这一点在最简单的坐标系求解。构造有用的坐标系是一门艺术,它有着相当的复杂性。 不过,在本节的情形中,由于 ηµν 是平直时空度规的最简单形式,因此方程(8.12)和(8.13)是“近平 (nearly flat)”度规分量的最简单、最自然形式。
  126. D raft T ranslation 122 CHAPTER 8. 爱因斯坦场方程 背景 Lorentz

    变换 SR 的 Lorentz 变换矩阵为 (Λ¯ α β ) =         γ −vγ 0 0 −vγ γ 0 0 0 0 1 0 0 0 0 1         , γ = (1 − v2)−1/2 (8.14) (对应于 x 方向速度 v 的 boost 变换) 。 对弱引力场,定义“背景 Lorentz 变换 (background Lorentz transformation)”为: x¯ α = Λ¯ α β xβ (8.15) 其中 (Λ¯ α β ) 就是 SR 中的 Lorentz 变换矩阵,它的矩阵元在各处都是常数。当然,弱引力场的时空 不同于 SR,因此背景 Lorentz 变换只是所有坐标变换中的一种。它有一个很好的性质,对度规张 量进行变换: g¯ α ¯ β = Λµ ¯ α Λν ¯ β gµν = Λµ ¯ α Λν ¯ β ηµν + Λµ ¯ α Λν ¯ β hµν . (8.16) Lorentz 变换满足条件 Λµ ¯ α Λν ¯ β ηµν = η¯ α ¯ β , (8.17) 由此可得 g¯ α ¯ β = η¯ α ¯ β + h¯ α ¯ β , (8.18) 其中 h¯ α ¯ β := Λµ ¯ α Λν ¯ β hµν . (8.19) 由此可见,在背景 Lorentz 变换下,hµν 就像 SR 中的张量那样进行变换!当然,hµν 不是张 量,而是 gµν 的一部分。背景 Lorentz 变换的性质产生了一种方便的虚拟看法:轻微弯曲的时空可 以视为定义于平直时空的“张量”hµν 。所有的物理场——例如 Rµναβ ——都通过 hµν 表示,它们也 “看起来像”定义在平直背景时空的场。然而,必须记住,弱引力场的时空是真真正正弯曲的,上述 的虚拟看法是由于只考虑一类坐标变换而导致的。下面会看到,这种虚拟在计算过程中十分有用。
  127. D raft T ranslation 8.3. 弱引力场的爱因斯坦方程 123 规范变换 保持(8.12)和(8.13)式形式不变的另一种重要的坐标变换是——坐标系进行如下微小的变化 xα′

    = xα + ξα(xβ), 这种变化是由“向量”ξα 产生的, 向量分量 ξα 是时空的函数。如果要求 ξα 是小量, 满足 |ξα ,β | ≪ 1, 则有 Λα′ β = ∂xα′ ∂xβ = δα β + ξα ,β , (8.20) Λα β′ = δα β − ξα ,β + 0(|ξα ,β |2). (8.21) 容易证明,保留到一阶小量时: gα′β′ = ηαβ + hαβ − ξα,β − ξβ,α (8.22) 其中定义了 ξα := ηαβ ξβ. (8.23) (8.22)式意味着坐标变换对 hαβ 的改变为 hαβ → hαβ − ξα,β − ξβ,α (8.24) 如果所有的 |ξα ,β | 都是小量,则新的 hαβ 仍是小量,变换后的坐标系仍是近 Lorentz 系。这种 坐标变换称为规范变换 (gauge transformation),这个名字来源于(8.24)式与电磁学中规范变换 的相似性,在本章习题 11 详细讨论。爱因斯坦方程的坐标自由度意味着(8.24)中的 ξα 可以是任意 (小量) “向量”。后面会利用这种自由度大大简化方程。 有必要对方程(8.21)和(8.22)中 α′, β′ 这样的指标进行说明,有些初学者对此不太明白。指标带 撇或带 bar 是为了表示是哪个在坐标系的分量,例如,gα′β′ 是张量 g 在 {xν′ } 坐标系中的分量。 这些指标的取值仍然是 (0, 1, 2, 3)。 方程(8.22)等号右侧的指标不带撇, 因为右侧的所有量都定义在不带撇的坐标系中。 方程(8.22)的 α = β = 0 的分量的含义为:张量 g 在带撇坐标系中的 0-0 分量,等于在不带撇坐标系中 η 的 0-0 分量加上不带撇坐标系中 hαβ 的 0-0“分量” 减去 两个 ξ0 关于不带撇坐标 x0 的导数项(按 照(8.23)式定义)。方程(8.22)看起来比较奇怪,因为与(8.15)不同,它等号两侧的指标不“匹配” 。但 是这可以接受,因为(8.22)式并非所说的张量方程,它只是表示了同一张量在两个特别的坐标系的 分量之间的关系,而不表示一般的、具有坐标系不变性的关系。 Riemann 张量 利用(8.12)式容易证明,保留到 hµν 的一阶小量时,Riemann 张量用 hµν 表示为:
  128. D raft T ranslation 124 CHAPTER 8. 爱因斯坦场方程 Rαβµν =

    1 2 (hαν,βµ + hβµ,αν − hαµ,βν − hβν,αµ ). (8.25) 从本章习题 5 可见,这些 Riemann 分量与规范无关,也就是说在(8.24)式的变化下不变。因 为在坐标变换下 R 的分量变换为原来分量的线性组合,一个微小的坐标变换——规范变换——将 分量变化了很小一部分;由于这些分量本身就是小量,因此分量的变化量是二阶小量,从而不改变 一阶近似(8.25)式的结构。 弱场爱因斯坦方程 下面总是采用前文介绍的虚构观点:hαβ 是“背景”Minkowski 时空上的张量,即 SR 中的张量。 这样的方程是 SR 的张量方程,而对一般的坐标变换不一定有效。规范变换也是允许的,但是我们 不把它们视为坐标变换。规范变换定义了一组等效的对称张量 hαβ :任何由方程(8.24)联系着的两 个 hαβ 产生的物理效果相同。 在这种观点下,定义指标上升的量为 hµ β := ηµαhαβ , (8.26) hµν := ηνβhµ β , (8.27) 相应的迹 h := hα α , (8.28) 定义 hαβ 相应的 trace reverse 张量为: ¯ hαβ := hαβ − 1 2 ηαβh. (8.29) “trace reverse”这一名字是因为 ¯ h := ¯ hα α = −h. (8.30) 此外,可以证明方程(8.29)的逆也具有相同的形式: hαβ = ¯ hαβ − 1 2 ηαβ¯ h. (8.31) 在定义了上述内容之后,从方程(8.25)出发,不难证明爱因斯坦张量为 Gαβ = − 1 2 [ ¯ h ,µ αβ,µ + ηαβ ¯ h ,µν µν − ¯ h ,µ αµ,β − ¯ h ,µ βµ,α + 0(h2 αβ ) ] . (8.32) (对任意函数 f,f,µ := ηµνf,ν 。 )
  129. D raft T ranslation 8.3. 弱引力场的爱因斯坦方程 125 显然,如果 ¯ hµν

    ,ν = 0 (8.33) 成立,则(8.32)式会大大简化。 上式代表 4 个方程,由于我们有 4 个自由的规范函数 ξα,因此要尝试找到一个规范使得方 程(8.33)成立,下面会证明总是可以找到这样合适的规范。因此,(8.33)式是一个规范条件,称为 Lorentz 规范条件, 满足该式的 hµν 称为是在 Lorentz 规范下的。 这种规范的名字来源于电磁学的 相似内容(见本章习题 11) 。这种规范在文献中出现的其它名字还有谐和规范 ( harmonic gauge)、 de Donder 规范。 Lorentz 规范存在性的证明如下。对于一般的 ¯ h(old) µν ,¯ h(old)µν ,ν ̸= 0,在规范变换(8.24)之下, ¯ hµν 变换为(作为本章习题 12) : ¯ h(new) µν = ¯ h(old) µν − ξµ,ν − ξν,µ + ηµν ξα ,α (8.34) 它的散度为 ¯ h(new)µν ,ν = ¯ h(old)µν ,ν − ξµ,ν ,ν (8.35) 满足 ¯ h(new)µν ,ν = 0 的规范的 ξµ 根据下式确定: □ξµ = ξµ,ν ,ν = ¯ h(old)µν ,ν (8.36) 其中 □ 是 Laplacian 的四维推广: □f = f,µ ,µ = ηµνf,µν = ( − ∂2 ∂t2 + ∇2 ) f. (8.37) □ 称为 D’Alembertian 或者波动算符,有时也记作 ∆。方程 □f = g (8.38) 是三维非齐次波动方程,对于(性质良好的)任意 g 都有解(参见 Choquet–Bruhat et al., 1977) , 因此总存在 ξµ 使得任意 hµν 变换到 Lorentz 规范。实际上,ξµ 并非唯一的,任何满足齐次波动方 程的 ηµ: □ηµ = 0 (8.39) 都可以加到 ξµ 上而不产生影响: □(ξµ + ηµ) = ¯ h(old)µν ,ν (8.40) 因此仍然在 Lorentz 规范下。所以 Lorentz 规范实际上是一类规范。
  130. D raft T ranslation 126 CHAPTER 8. 爱因斯坦场方程 在 Lorentz

    规范下,方程(8.32)化为(作为本章习题 10) : Gαβ = − 1 2 □¯ hαβ. (8.41) 于是弱场爱因斯坦方程为 □¯ hµν = −16πTµν. (8.42) 上式称为“线性化理论”的场方程,因为上式对 hαβ 是线性的。 8.4 牛顿引力场 牛顿极限 牛顿引力理论在引力场很弱、粒子速度远小于光速的时候有效:|ϕ| ≪ 1, |v| ≪ 1。在这种情况 下,GR 必须得到与牛顿理论一致的预言。对分量 Tαβ 而言,速度很小通常意味着 |T00 ≫ |T0i| ≫ |Tij|, “通常”的含义是在某些特殊情况下 T0i = 0,因此第二个不等式失效。但是在高速旋转的、可 以用牛顿理论描述的恒星中,T0i 远大于任何 Tij。 上述不等式通过方程(8.42)化为关于 ¯ hαβ 的不等式:|¯ h00| ≫ |¯ h0i| ≫ |¯ hij|。与上面相似,这个 不等关系也是有限制的:(8.42)式左侧可以添加任何满足 □aµν = 0 的齐次项,这种方程解的分量 大小不受 Tαβ 大小关系的限制。下一章会看到,这些齐次项对应引力波。因此关于 ¯ hαβ 分量的大 小关系 |¯ h00| ≫ |¯ h0i| ≫ |¯ hij| 只适用于没有引力辐射的情形。当然,牛顿理论是没有引力波的,因 此上述不等式在牛顿近似的过程中有效。于是,描述“牛顿”引力场的主导性的场方程为 □¯ h00 = −16πρ, (8.43) 其中利用了 T00 = ρ + 0(ρv2)。场的变化只是由于源的运动(速度 v)产生的,因此 ∂/∂t 与 v∂/∂x 是同阶量,因此 □ = ∇2 + 0(v2∇2). (8.44) 于是(8.43)式化为(只保留最低阶) : ∇2¯ h00 = −16πρ. (8.45) 上式与牛顿方程(8.1) ∇2ϕ = 4πρ (with G = 1)
  131. D raft T ranslation 8.4. 牛顿引力场 127 比较可得: ¯ h00

    = −4ϕ. (8.46) 因为 ¯ hαβ 的其它所有分量都是高阶小量,因此 h = hα α = −¯ hα α = ¯ h00, (8.47) 由此导出 h00 = −2ϕ, (8.48) hxx = hyy = hzz = −2ϕ, (8.49) 线元的形式为 ds2 = −(1 + 2ϕ)dt2 + (1 − 2ϕ)(dx2 + dy2 + dz2). (8.50) 这就是方程(7.8)剧透的度规。我们看到,这个度规给出了正确的牛顿运动定律,它是场方程在牛顿 极限下导出的,因此证明了牛顿理论是 GR 的极限形式。另外,上述推导也验证了爱因斯坦方程的 系数 k 的正确值是 8π。 大部分天体系统可以用牛顿理论做一阶近似描述,但是仍有很多系统的重要内容在牛顿理论 之外的修正当中,这称为后牛顿效应,本章习题 19、20 讨论了其中两种。太阳系中的后牛顿效应 是广义相对论最著名的实验验证之一,例如水星近日点的进动、太阳的光线偏折,第11章对这两 者进行研究。太阳系之外最重要的后牛顿效应是脉冲双星的轨道收缩,它确认了广义相对论在引 力辐射存在情况下的理论预言(见第9章) 。因此,后牛顿效应提供了广义相对论的重要的高精度 实验检验,目前已经建立了描述这些效应的良好理论,更高阶的近似也可以计算 (Blanchet 2006, Futamase and Itoh 2007)。 静态相对论性场源的远处引力场 考虑爱因斯坦方程的完整形式,对于任何处在有界区域的场源(“局域化”源) ,在距离该源很远 的地方引力场为弱场,线性化理论可以应用于远处区域。我们称这种时空是渐近平直 (asymptot- ically flat) 的:时空在距离场源很远的地方逐渐近于平直。 能否采用上文的推导、得出结论说远处的引力场可以用关于牛顿势 ϕ 的方程(8.50)描述?不 行。第一,(8.50)式的推导过程假设了时空各处的引力场都很弱,包括引力场源内部的区域,因为 推导过程中的关键一步是在场源之内将(8.45)与(8.1)式进行对应。而本节的情况没有假设源内部的 引力场也是弱场。第二个原因是,高度相对论性的源的牛顿势 ϕ 无从定义,因此(8.50)式没法解释。 因此,我们应该从线性化的场方程出发。由于已经假设了引力场源 Tµν 是静态的(即与时间 无关) ,因此可以假设远离场源处的 hµν 与时间无关。 (之后会放宽这个假设。 )于是在远处(8.42)式 化为 ∇2¯ hµν = 0, (8.51)
  132. D raft T ranslation 128 CHAPTER 8. 爱因斯坦场方程 上式具有解 ¯

    hµν = Aµν r + 0(r−2), (8.52) 其中 Aµν 是常数。此外还要满足规范条件(8.33)式: 0 = ¯ hµν ,ν = ¯ hµj ,j = −Aµjnj /r2 + 0(r−3), (8.53) 其中对 ν 的求和化为了对 j 的求和,因为 ¯ hµν 与时间无关。nj 是单位径向分量: nj = xj r . (8.54) 方程(8.53)对所有 xi 都成立,因此 Aµj = 0, ∀ µ, j. (8.55) 这意味着只有分量 ¯ h00 非零(高阶小量被省略) ,换句话说,在远离场源的地方 |¯ h00| ≫ |¯ hij|, |¯ h00| ≫ |¯ h0j|. (8.56) 这些条件保证了远处的引力场与牛顿引力场的性质相似,因此可以反过来利用导出(8.46)式的对应 关系,将任意静态场源远处引力场的“牛顿势”定义为 (ϕ)relativistic far field := − 1 4 (¯ h00)far field . (8.57) 在这种对应之下,方程(8.50)也变得有意义,它描述了远离场源的引力场。 相对论性系统的质量定义 在距离牛顿引力源很远的地方,引力势等于 (ϕ)Newtonian far field = − M r + 0(r−2), (8.58) 其中 M 是源的质量 (with G = 1)。因此,如果将(8.52)式当中的常数 A00 重命名为 4M,则根据 对应关系(8.57)式可得 (ϕ)relativistic far field = − M r . (8.59) Any small body, for example a planet, that falls freely in the relativistic source’s gravitational field but stays far away from it will follow the geodesics of the metric, Eq. (8.50), with ϕ given by Eq. (8.59). 在第7章中已经看到,相应的测地线服从质量为 M 物体引力场的开普勒定律。因此将常量 M 定义为相对论性引力场源的总质量。 注意,这个定义并非是对引力源整体的积分:并没有将构成引力源的所有粒子的质量相加,而 只是通过引力源对远处测试物体的运动轨道的影响效果来测量(“称量”)源的质量,天文学家就是
  133. D raft T ranslation 8.5. 扩展阅读 129 用这种方法测量地球、太阳和行星的质量。在这样的定义下,方程(8.50)可以写成描述任何静态引 力源远场的形式: ds2

    = − [ 1 − 2M r + 0(r−2) ] dt2 + [ 1 + 2M r + 0(r−2) ] (dx2 + dy2 + dz2). (8.60) 还是要牢记,由于这种质量并非是对引力源进行积分来定义的,因此场源的远处引力场常量 M 会与牛顿理论中的质量相当不同,例如黑洞,还可以参考本章习题 20 对有效引力质量 (active gravitational mass) 的讨论。 将波动方程(8.42)简化为 Laplace 方程(8.51)的必要假设是静态引力源。随时间变化的源可以 发射引力波,下一章会看到,引力波以光速向外传播,并且不服从(8.56)的不等式,因此无法当作 牛顿引力场处理。然而,在一些情况下仍然可以方便地使用上面定义的质量:如果引力波很弱,则 与波动部分相比,静态部分 ¯ h00 占据主导,或者引力场源在遥远的过去是静态的,这样总可以选择 足够大的 r 使得任何波动都还来不及传到大于 r 的区域。随时间变化的源的质量定义在高阶教材 中有详述,例如 Misner et al. (1973) or Wald (1985). 8.5 扩展阅读 有很多方法可以“导出” (实际上只是 justify) 爱因斯坦场方程, 参见下面列举的教材。弱场方程 (或者称为线性化场方程)在研究中更为常用,因为完整的场方程太难解了,后面的章节会对线性 化方程大用特用,大部分教材都是这么干的。本章处理牛顿极限的方法具有启发性、探索性,但是 存在着更加严格的方法可以解释牛顿方程的几何本质 (Misner et al. 1973, Cartan 1923) 以及牛顿 极限的渐近本质 (Damour 1987, Futamase and Schutz 1983)。Blanchet (2006) 以及 Futamase and Itoh (2007) 是描述后牛顿理论的综述文献。爱因斯坦本人导出场方程的方法不如本章的方法直接, 学者们研究过他的笔记发现,他考虑过的一些背景假设最终被证明是错误的,参见 Renn (2007) 编 辑的纪念碑性质的文集。 下面应该列举几本广泛采用的 GR 教材,以读者需要的背景知识与内容的复杂程度分类。有 些教材只需要很少的背景知识——Hartle (2003), Rindler (2006);有些是一年级研究生的教材—— Carroll (2003), Glendenning (2007), Gron and Hervik (2007), Hobson, et al. (2006), 一部分 Misner et al. (1973), Møller (1972), Stephani (2004), Weinberg (1972), and Woodhouse (2007);还有一 些假设读者已经身经百战见得多了——Hawking and Ellis (1973),Landau and Lifshitz (1962), 大部 分 Misneretal.(1973), Synge (1960), and Wald (1984)。掌握了本书的内容之后应该可以阅读上面 即使是最难的教材。 做习题是学习一门理论不可缺少的,习题集 Lightman et al. (1975) 尽管年代久远,但仍然是 出色的补充材料。Schutz(2003) 是一本涉及不多数学的导论教材。 8.6 习题
  134. D raft T ranslation Chapter 10 星体的球对称解 10.1 球对称时空中的坐标 作为我们所研究的

    GR 中强引力场的第一个例子,我们将讨论球对称系统。鉴于相当多的天 体物理对象都近似是球形的,它们相对简单而其物理又非常重要。下面从选取能够反映这种对称性 的坐标系出发。 球坐标系下的平直时空 采用通常的坐标定义 (r, θ, ϕ),Minkowski 空间的线元可以写成 ds2 = −dt2 + dr2 + r2(dθ2 + sin2 θ dϕ2). (10.1) 所有 r 和 t 皆为常数的曲面都是球面, 精确的说, 二球面——二维的球体表面。 通过取 dt = dr = −0 可以得到球面上曲线的长度 dl2 = r2(dθ2 + sin2 θ dϕ2) := r2 dΩ2, (10.2) 其中定义了记号 dΩ2 代表立体角元。我们注意到这样一个球面具有周长 2πr 以及面积 4πr2,即分 别是 2π 乘上 dΩ2 前系数的平方以及 4π 乘上 dΩ2 前的系数。相对地,所有具有(10.2)式给出的线 元形式且 r2 独立于 θ 和 ϕ 的二曲面,都具有与二球面相同的内禀几何。 图 10.1: 两个平面被一根环形的喉管连接起来:其具有中心(轴)对称性,但任何圆环的中心点都不在这个二平面上。 133
  135. D raft T ranslation 134 CHAPTER 10. 星体的球对称解 弯曲时空中的二球面 现在可以对于球对称时空进行更准确的描述:它意味着时空中所有位于某一个二曲面上的点

    都位于一个二球面上,即,其线元为 dl2 = f(r′, t)(dθ2 + sin2 θ dϕ2), (10.3) 其中 f(r′, t) 是关于流形上另外两个坐标 r′ 和 t 的未知函数。每个球面的面积都是 4πf(r′, t)。我 们定义球对称几何下的径向坐标满足 f(r′, t) := r2。这代表着一个从 (r′, t) 到 (r, t) 的坐标变换。 任何 r 为常数且 t 为常数的曲面都是一个具有面积 4πr2 以及周长 2πr 的二球面。由于 r 定义了球 面的曲率半径以及面积,其被称为“曲率坐标”或者“面积坐标”。球心到其表面的距离与 r 之间并不 存在一个先验的关系。r 只能描述球面自身的性质。由于其中心(在平直时空中位于 r = 0 处)并 不在球面上,一个球对称的空间甚至不需要在中心存在一个点。一个简单的反例如图10.1所示,那 些圆环的中心并不存在一个点。该空间包含两页通过一个“喉管”连接起来。整个相对于喉管中心轴 轴对称,但轴上的点——即圆环的“中心”——并不属于这个二维曲面。如果令 ϕ 为极角,每个圆环 上的线元为 r2 dϕ2,其中 r 为用于标记每个圆环的常数。这个 r 是和我们用以描述球对称时空一 类的坐标。 将二球面在 t 为常数的三空间中网格化 考虑 r 和 r + dr 处的两个球面。他们具有同样的坐标系统 (θ, ϕ),但至此我们并没有要求它 们有什么联系。即,可以假想 r 处的球面的极点有一个取向,而 r + dr 处的有另一个取向。明智 的选择是让 θ 和 ϕ 均为常数的线与二球面正交。根据定义,这样一条线具有一个切向量 ⃗ er 。鉴于 向量 ⃗ eθ 和 ⃗ eϕ 躺在球面上,我们要求 ⃗ er · ⃗ eθ = ⃗ er · ⃗ eϕ = 0。这意味着 grθ = grϕ = 0(回忆(3.3)式 和(3.21)式) 。这是一个因球对称而容许的坐标定义。从而度规局限于如下形式 ds2 = g00 dt2 + 2g0r dr dt + 2g0θ dθ dt + 2g0ϕ dϕ dt + grr dr2 + r2 dΩ2. (10.4) 球对称时空 由于整个时空,而不仅仅是 t 为常数的空间是球对称的,我们要求 r, θ, ϕ 均为常数的线同 样也正交于二球面。否则空间中将存在一个特殊的方向。这意味着 ⃗ et 正交于 ⃗ eθ 和 ⃗ eϕ ,或者说 gtθ = gtϕ = 0。从而现在我们有 ds2 = g00 dt2 + 2g0r dr dt + grr dr2 + r2 dΩ2. (10.5) 这就是球对称时空中度规的一般形式,其中 g00 , g0r 和 grr 都是 r 和 t 的函数。我们使用了坐标自 由度将其约简为最简单的形式。
  136. D raft T ranslation 10.2. 静态球对称时空 135 10.2 静态球对称时空 度规

    自然,最简单的物理情形便是一颗静止的星体或者黑洞——一个静态系统。我们定义静态时空 为这样一个时空,其时间坐标 t 满足条件:(i) 所有度规分量与 t 无关;(ii) 在时间反演 t → −t 下, 几何不变。第二个条件意味着在这个情形下制成的电影倒放的时候也一样。这并不能由 (i) 从逻辑 上得到,典型的反例是一个转动的星体:时间反演改变旋转的方向,但度规却不依赖于时间。 (满 足条件 (i) 但不满足条件 (ii) 的时空被称为稳态的。 ) 根据条件 (ii) 可以得到如下结论。坐标变换 (t, r, θ, ϕ) → (−t, r, θ, ϕ) 有 Λ¯ 0 0 = −1, Λi j = δi j , 从而 g¯ 0¯ 0 = (Λ0 ¯ 0 )2g00 = g00 , g¯ 0¯ r = Λ0 ¯ 0 Λr ¯ r g0r = −g0r , g¯ r¯ r = (Λr ¯ r )2grr = grr .          (10.6) 由于几何不变的要求(即 g¯ α ¯ β = gαβ ) ,可知 g0r ≡ 0。那么,静态球对称时空的度规为 ds2 = −e2Φ dt2 + e2Λ dr2 + r2dΩ2, (10.7) 其中我们引入了 Φ(r) 和 Λ(r) 用以替换两个未知的 g00 (r) 和 grr (r)。 在已知处处 g00 < 0 及 grr > 0 时,这个替换是容许的。稍后我们将看到这个条件对于星体内部也能保持,但对于黑洞不成立。在 下一章讨论黑洞之前,我们仍然得仔细的审视一番我们的坐标系。 如果对星体这类有界系统感兴趣,我们应当有理由要求在远离星体的地方,时空几乎是平直 的。这意味着可以给 Einstein 方程加上如下边界条件(或者说渐进正则性条件) lim r→∞ Φ(r) = lim r→∞ Λ(r) = 0. (10.8) 在这个条件下我们可以说时空是渐进平直的。 度规中诸项的物理诠释 鉴于我们已经构造了能够反映时空物理对称性的坐标,度规各分量便存在着有用的物理意义。 从任意半径 r1 到半径 r2 的本征径向距离为 l12 = ∫ r2 r1 eΛ dr, (10.9) 假定了这是一条 dt = dθ = dϕ = 0 的曲线。g00 的意义更为重要。由于度规与 t 无关,而我们从 第7章中得知任何沿测地线运动的粒子会有一个守恒的动量分量 p0 ,可以定义为常数 −E: p0 := −E. (10.10)
  137. D raft T ranslation 136 CHAPTER 10. 星体的球对称解 但是一个位于时空中半径 r

    处(瞬时)静止的局域惯性观者会测量到一个不同的能量。她的四速 度1满足 Ui = dxi dτ = 0(由于她是瞬时静止的) ,条件 ⃗ U · ⃗ U = 1 说明 U0 = e−Φ。那么她测量得到 的能量为 E∗ = −⃗ U · ⃗ p = e−ΦE. (10.11) 从而我们发现一个用常数 E 标记的沿测地线运动的例子相对时空中的静态局域惯性观者具有能量 e−ΦE。由于在远处 e−Φ = 1,那么可知对于一个外部的观者来说粒子在远离后的能量为 E。我们 将其称为无穷远处的能量。由于处处 e−Φ > 1(稍后我们将看得更明白) ,那么对于其所经过的任 何一个惯性观者来说其都有一个更大的能量。额外的能量来自于在引力场中的下落。能量问题将 在10.9节中的习题 3 中详细讨论。 这对于光子来说尤其意义重大。考虑 r1 处发射出的一个光子,在远处被接收。如果其局域惯 性系中的频率是 νem (由其发射过程决定,如光谱线) ,那么其局域能量便是 hνem (h 是 Planck 常数),守恒常数 E 为 hνem exp[Φ(r1 )]。当被远处的观者测量到时,其具有能量 E,那么频率 E/h = νrec = νem 。光子的红移定义为 z = λrec − λem λem = νem νrec − 1, (10.12) 从而 z = e−Φ(r1) − 1. (10.13) 这个重要的式子触及了 eΦ 的物理意义。 (与第2章中的计算相对比。 ) Einstein 张量 可以证明,对于形如(10.7)式的度规,Einstein 张量有分量 G00 = 1 r2 e2Φ d dr [r(1 − e−2Λ)], (10.14) Grr = − 1 r2 e2Λ(1 − e−2Λ) + 2 r Φ′, (10.15) Gθθ = r2e−2Λ[Φ′′ + (Φ′)2 + Φ′/r − Φ′/Λ′ − Λ′/r], (10.16) Gϕϕ = sin2 θGθθ , (10.17) 其中 Φ′ := dΦ/dr。其他全部分量都为零。 1译注:此处用词有误?
  138. D raft T ranslation 10.3. 静态理想流体的 EINSTEIN 方程 137 10.3

    静态理想流体的 Einstein 方程 应力-能量张量 我们对静态星体感兴趣,即没有运动的流体。⃗ U 仅有的非零分量为 U0。此外,归一化条件 ⃗ U · ⃗ U = −1 (10.18) 给出,如我们之前所看到的那样 U0 = e−Φ, U0 = −eΦ. (10.19) 那么由(4.38)式,可以给出 T 的分量: T00 = ρe2Φ, (10.20) Trr = pe2Λ, (10.21) Tθθ = r2p, (10.22) Tϕϕ = sin2 θTθθ . (10.23) 其他全部分量为零。 状态方程 应力-能量张量包含了 p 和 ρ,但它们可能由一个状态方程相联系。对于处于局域热平衡态的 简单流体,总存在着如下形式的关系 p = p(ρ, S), (10.24) 给出了压强 p 对于能量密度 ρ 和比熵 S 的关系。我们经常处理那些熵可以被看做是常数的情形 (具体而言,改变量小到可以忽略) ,那么就有关系 p = p(ρ). (10.25) 这个关系对于不同的流体自然有不同的函数形式。我们将假定某些这类关系始终存在。 运动方程 守恒律((7.6)式) : Tαβ ;β = 0. (10.26) 自由指标的每一个取值都包含了一个方程。由于对称性,其中只有一个式子不会恒为零:α = r 的 情形。即
  139. D raft T ranslation 138 CHAPTER 10. 星体的球对称解 (ρ +

    p) dΦ dr = − dp dr . (10.27) 这个式子告诉我们为使流体在引力场中静止所需要的压强梯度,这个效应依赖于 dΦ/dr。 Einstein 方程 Einstein 方程的 (0, 0) 分量可以从(10.14)式和(10.20)式中得到。此时将 Λ(r) 替换成另一个未 知函数 m(r) 将是便利的 m(r) := 1 2 r(1 − e−2Λ), (10.28) 换言之 grr = e2Λ = ( 1 − 2m(r) r )−1 . (10.29) (0, 0) 分量式得到 dm(r) dr = 4πr2ρ. (10.30) 这和 Newton 方程有着同样的形式,其中 m(r) 需要解释成半径为 r 的球体内部的质量。从而, 在相对论中我们把 m(r) 称为质量函数,但由于在 GR 中总能量并不是可局域化的,其并不能被诠 释为 r 以内的质能。我们将在下面的10.5节中去讨论 Newton 引力的类似物。 来自(10.15)式和(10.21)式的 (r, r) 分量式,可以写成 dΦ dr = m(r) + 4πr3p r[r − 2m(r)] . (10.31) 如果我们还有一个(10.25)式形式的状态方程,那么联立(10.25)、(10.27)、(10.30)、(10.31)四式 可以求解出四个位置函数 Φ, m, ρ, p。如果需要考虑一般性的状态方程(10.24),那么 S 便成了完全
  140. D raft T ranslation 10.4. 外部的几何 139 没有约束的一个函数。从 Einstein 方程的

    (θ, θ) 式和 (ϕ, ϕ) 式出发不能得到任何额外的信息,因 为 (i) 从(10.16)、(10.17)、(10.22)和(10.23)式可以看出这两个式子是等价的;(ii)Bianchi 恒等式保 证了其为(10.26)、(10.30)和(10.31)式的必然推论。 10.4 外部的几何 Schwarzschild 度规 在星体之外,我们有 ρ = p = 0,从而得到两个方程 dm dr = 0, (10.32) dΦ dr = m r(r − 2m) . (10.33) 它们有解 m = M = 常数, (10.34) e2Φ = 1 − 2M r , (10.35) 其中使用了 r → ∞ 时 Φ → 0 的约束条件。可见外部的度规具有如下 Schwarzschild 度规的形式: ds2 = − ( 1 − 2M r ) dt2 + ( 1 − 2M r )−1 dr2 + r2 dΩ2. (10.36) 对于大的 r 上式写作 ds2 ≈ − ( 1 − 2M r ) dt2 + ( 1 + 2M r ) dr2 + r2 dΩ2. (10.37) 换回到坐标系 (x, y, z) 中可以得到 ds2 ≈ − ( 1 − 2M R ) dt2 + ( 1 + 2M R ) (dx2 + dy2 + dz2), (10.38) 其中 R := (x2+y2+z2)1/2。 我们可以看到这就是一个具有总质量 M 的星体的远场度规 (见(8.60)式) 。 这检验了(10.28)式以及对于符号 M 的选择。 度规的一般化 作为一个更一般化的处理,如 Misner et al. (1973) 中所述, 基于 Brikhoff 定理,Schwarzschild 解(10.36)式,是真空 Einstein 场方程唯一的球对称、渐进平直解,也即可以不管静态的假设而 从(10.5)式出发。这意味着即便对于一个径向震荡或者坍缩的星体也会有一个具有常数 M 的静态 外部度规。从中可以得到的一个结论是球对称震荡的系统不存在引力波。 (在电磁学中也一样:不 存在‘单极矩’辐射。 )从??节习题 40 中的线性化理论中也可以得到这个结果。
  141. D raft T ranslation 140 CHAPTER 10. 星体的球对称解 10.5 星体的内部结构

    在星体内部,有 p ̸= 0, ρ ̸= 0,那么可以将(10.27)式除以 (ρ + p),并用以从(10.31)式中消去 Φ。 结果被称为 Tolman-Oppenheimer-Volkov (T-O-V) 方程: dp dr = − (ρ + p)(m + 4πr3p) r(r − 2m) . (10.39) 联立关于 dm/dr 的(10.30)式,以及具有(10.25)式形式的状态方程,共给出了三个分别关于 m, ρ, p 的方程、 我们将 Φ 放到了一个附属的位置上:在完成方程组的求解后可以通过计算(10.27)式 得到。 对方程组积分的一般规则 由于有(10.30)和(10.39)两个一阶微分方程, 它们需要两个积分常数, 分别是 m(r = 0) 和 p(r = 0)。现在我们来论证 m(r = 0) = 0。考虑半径为 r = ε 的一个小球体,周长为 2πε,本征半径为 |grr |1/2ε(从线元中得到)。从而 r = 0 处的一个小圆其周长与半径之比为 2π|grr |1/2。但如果时空在 r = 0 处是局域平直的,如同流形上任何一点都需要满足的那样,r = 0 附近的一个小圆环的周长 与半径之比为 2π。从而 |grr (r = 0)| = 1,那么随着 r 趋于零,m(r) 得比 r 更快的趋于零。另一 个积分常数 p(r = 0) := pc ,或者在状态方程下等价的说,ρc ,完全确定了星体模型。对于一个给 定的状态方程 p = p(ρ),全部球对称静态星体模型构成一个单参数序列,其参数可取作中心密度。 这是一阶常微分方程唯一性定理的直接推论。 当 m(r), p(r) 和 ρ(r) 都已知后,星体的表面由 p = 0 的点所确定。 (注意,据(10.39)式,压强 随着远离中心单调下降。 )p = 0 代表表面的原因是 p 必须处处连续,否则流体元上就会作用无穷 大的压强梯度即无穷大的力。由于星体外的真空中是 p = 0,那么表面自然也要 p = 0。这样我们 只要积分到那儿就能停了,并令外部度规为 Schwarzschild 度规。令表面的半径为 R。为了保证几 何的连续性,度规需要再 r = R 处连续。在星体之内我们有 grr = ( 1 − 2m(r) r )−1 , (10.40) 在外部有 grr = ( 1 − 2M r )−1 . (10.41) 连续性条件可以确定常数 M M := m(R). (10.42) 那么远处观者测得星体的总质量由下面的积分给出
  142. D raft T ranslation 10.5. 星体的内部结构 141 M = ∫

    R 0 4πr2ρ dr, (10.43) 和 Newton 理论的结果一样。这个类似物具有某种误导性,因为积分中的体积元 4πr2 dr 并不 是本征体积。t = 常数的超曲面上的本征体积元为 |g|1/2 d3x = eΛr2 sin θ drdθdϕ, (10.44) 其中,在积掉 (θ, ϕ) 之后,得到的是 4πr2eΦ+Λ dr。从而 M 也就不具有所有流体元的本征能量之 和。本征体积和坐标体积的区别在于‘引力势能’给坐标上的总质量有贡献。我们不会对此作更多的 探讨,这里一说只是为了提醒在将 Newton 的诠释用于相对论方程时需要小心。 有了 M 便可以确定星体外的 g00 了,而表面上的 g00 为: g00 (r = R) = − ( 1 − 2M R ) . (10.45) 这给最后一个,用以确定星体内的 Φ 微分方程(10.27)式,提供了积分常数。从而便可以得到完整 的解。 注意对于我们的寻常星体, 始终有 2m(r) < r。这在 r = 0 附近肯定是对的, 因为我们有 r = 0 处 m(r)/r → 0 的要求。如果在某处 r1 出现了 r − 2m(r) = ε 的情况,其中 ε 是个小量并随 r 下 降,那么根据 T-O-V 方程(10.39)式,压强梯度会到 1/ε 的数量级且为负。这会使得压强在 ε 达到 零之前从某一个有限值迅速下降至零。当 p 到零了,我们就到了星体的表面。在那之外,m 是个 常数而 r 继续增大。所以对于一个寻常星体,时空中没有一点 m(r) 可以赶上 1 2 r。 Newton 星体的结构 在正式求解之前,我们可以先简单看一下这些方程在 Newton 极限下的情况。在 Newton 情形 下我们有 p ≪ ρ,那么就有 4πr3p ≪ m。此外,时空几乎是平直的,所以由(10.29)式有 m ≪ r。这 些不等式将(10.39)式简化为 dp dr = − ρm r2 . (10.46) 这就是 Newton 星体的流体静力平衡方程(见 Chandrasekhar 1939) , 从之前我们对 m 的诠释以及 Newton 极限下 ρ 就是质量密度看来, 这个事实并不让人惊讶。将(10.46)式与其原型(10.39)式相比, 可知所有相对论关联都在使压强梯度相比 Newton 情形更陡峭。换句话说,相比 Newton 引力,在 GR 中需要更强的内应力使得流体保持静止。这可以粗糙的解释成其预示了更强的场。其一个极端 情形时引力塌缩:场过于强以至于任何流体压强都不能抵抗它。我们将在10.7节中详细讨论。
  143. D raft T ranslation 142 CHAPTER 10. 星体的球对称解 10.6 严格的内部解

    在 Newton 理论中, 对于一个给定的状态方程, (10.30)式和(10.39)式很难求得解析解。 相对论情 形下就更糟了。2我们考虑相对论性方程的两个解,一个来自 Schwarzschild,另一个来自 Buchdahl (1981)。 Schwarzschild 等密度内部解 为减少求解(10.30)式和(10.39)式的困难,我们作出如下假定 ρ = 常数. (10.47) 其替代了状态方程。显然,其不存在物理上的正当性。实际上,正比于 (dp/dρ)1/2 的声速成了无 穷大!尽管如此,致密的中子星内部几乎是等密度的,从而这个解除了能作为一个教学上的例子告 诉我们怎么求解这个系统之外,也有着其他的一些用处。 我们可以直接积分(10.30)式 m(r) = 4πρr3/3, r ≤ R, (10.48) 其中 R 是待定的星体半径。在 R 以外密度为零,从而 m(r) 是个常数。由于 grr 的连续性要求,可 知 m(r) 一定在 R 处连续。从而有 m(r) = 4πρR3/3 := M, r ≥ R, (10.49) 其中我们引入了常数 M,Schwarzschild 质量。 现在可以求解 T-O-V 方程(10.39)式了 dp dr = − 4 3 πr (ρ + p)(ρ + 3p) 1 − 8πr2ρ/3 . (10.50) 从任意的中心压强 pc 出发,很容易将上式积分 ρ + 3p ρ + p = ρ + 3pc ρ + pc ( 1 − 2 m r )1/2 . (10.51) 从中可以得到 R2 = 3 8πρ [1 − (ρ + pc )2/(ρ + 3pc )2] (10.52) 亦或是 pc = ρ[1 − (1 − 2M/R)1/2]/[3(1 − 2M/R)1/2 − 1], (10.53) 2如果能随便选状态方程的话, (10.46)式和(10.39)式不会很难解。例如, 我们可以随便假定一个函数 m(r), 从(10.30)式 导出 ρ(r),然后期望能够从(10.46)式或者(10.39)式中得到 p。最后的两个函数 p(r) 和 ρ(r) 可以通过消去 r 来得到‘状态 方程’p = p(ρ)。这不像是能反映物理现实的样子,从而天体物理学者们对这样导出的多数解都不感兴趣。
  144. D raft T ranslation 10.6. 严格的内部解 143 消去(10.51)中的 p 后可得3

    p = ρ (1 − 2Mr2/R3)1/2 − (1 − 2M/R)1/2 3(1 − 2M/R)1/2 − (1 − 2Mr2/R3)1/2 . (10.54) 注意(10.53)式隐含着当 M/R → 4 9 时有 pc → ∞。稍后我们会看到这个结论对于其他类型的相对 论性星体也适用。 求解(10.27)式得到 Φ 后便完成了均匀密度情形的求解。从 g00 处的连续性条件就可以得到 R 处的 Φ 值: g00 (R) = −(1 − 2M/R). (10.55) 从而,可以得到 exp(Φ) = 3 2 (1 − 2M/R)1/2 − 1 2 (1 − 2Mr2/R3)1/2, r ≤ R. (10.56) 注意 Φ 和 m 都随着 r 单调递增,而 p 单调递减。 Buchdahl 内部解 Buchdahl (1981) 找到了对于如下状态方程的一个解 ρ = 12(p∗ p)1/2 − 5p, (10.57) 其中 p∗ 是任意常数。尽管这个方程不存在任何物理基础,但其具有两个漂亮的性质:(i) 通过要求 局域声速 (dp/dρ)1/2 小于 1,可以处处满足因果律;(ii) 对于小的 p 值,方程约化为 ρ = 12(p∗ p)1/2, (10.58) 这对应于 Newton 星体结构理论中 n = 1 多方球。n = 1 多方球是 Newton 系统中少许的可解模型 之一(见10.9节习题 14) ,从而 Buchdahl 解可以看做其相对论性推广。因果律要求 p < p∗ , ρ < 7p∗ . (10.59) 如同多数严格解4一样,从方程的标准形式很难直接得到。在这里,我们需要另一个径向坐标 r′。其用寻常的 r 通过由(10.61)式隐式的定义,其中有第二个任意常数 β,以及函数5 u(r′) := β sin Ar′ Ar′ , A2 := 288πp∗ 1 − 2β . (10.60) 从而写下 r(r′) = r′ 1 − β + u(r′) 1 − 2β . (10.61) 3译注:原文下式为“pc = . . . ” ,改正为 p。 4严格解指的是其能被写成一些关于坐标的简单函数的组合, 例如多项式和三角函数。寻找这类解是一种艺术, 需要有用 的坐标系、简单的几何、优秀的直觉以及占主导地位的运气的成功结合。相关的综述参见 Stefani et al. (2003)。 5Buchdahl 对于这些参数使用了不同的记号
  145. D raft T ranslation 144 CHAPTER 10. 星体的球对称解 这里我们不去展示如何求得解(可参考 Buchdahl

    1981) ,而仅仅是将其写下。通过(10.7)式所定义 的度规函数,我们有,在 Ar′ ≤ π 下 exp(2Φ) = (1 − 2β)(1 − β − u)(1 − β + u)−1, (10.62) exp(2Λ) = (1 − β)(1 − β + u)(1 − β − u)−1(1 − β + β cos Ar′)−2, (10.63) p(r) = A2(1 − 2β)u2[8π(1 − β + u)2]−1, (10.64) ρ(r) = 2A2(1 − 2β)u(1 − β − 3 2 u)[8π(1 − β + u)2]−1, (10.65) 其中 u = u(r′)。表面 p = 0 位于 u = 0 处,即 r′ = π/A ≡ R′。在那儿,有 exp(2Φ) = exp(−2Λ) = 1 − 2β, (10.66) R ≡ r(R′) = π(1 − β)(1 − 2β)−1A−1. (10.67) 即,β 为 M/R 在表面上的值,而(10.13)给出光的红移为 zs = (1 − 2β)−1/2 − 1. (10.68) 自然,非相对论极限对应于 β → 0。星体的质量由下式给出 M = πβ(1 − β) (1 − 2β)A = [ π 288p∗ (1 − 2β) ]1/2 β(1 − β). (10.69) 由于 β 决定了星体有多“相对论性” ,而常数 p∗ (或者 A)给出了整个系统的标度。通过恰当选取具 体的单位,可以得到任何想得到的值。而 β 的改变才能给出这个模型结构非平凡的改变。β 的下 界我们已经提过了,是零。而上界来自于因果律(10.59)式的要求,观察(10.64)式和(10.65)式可知 p/ρ = 1 2 u(1 − β − 3 2 u)−1, (10.70) 其在中心 r = 0 处取得极大值: pc /ρc = β(2 − 5β)−1. (10.71) 要求上式小于 1 7 得到 0 < β < 1 6 . (10.72) 其提供了一个从 Newton 情形 (β ≈ 0) 到强相对论区(表面红移 0.22)连续变换的物理上可信的模 型。
  146. D raft T ranslation 10.7. 相对论性星体和引力塌缩 145 10.7 相对论性星体和引力塌缩 Buchdahl

    定理 前面一小节里我们知道均匀密度星体的半径不会小于 (9/4)M,否则的话需要无穷大的压强来 使星体保持静态!这个事实对于任何星体模型都成立,其被称为 Buchdahl 定理 (Buchdahl 1959)。 假定我们构造了一个处于平衡态的半径 R = 9M/4 的星体,并给它一个(球对称的)向内推 动。它除了向内塌缩之外别无选择:它再也无法达到静态了。但在塌缩过程中,外部度规依旧是 Schwarzschild 度规。即,在外部留下了真空 Schwarzchild 几何。这就是黑洞的度规,在下一章中 将会详细讨论。现在我们先看看诱发星体塌缩的一些原因。 星体质量黑洞的形成 任何实际的对于黑洞形成概率的估计都要建立在对星体演化行为的理解之上。这个我们给出 一个简单的总结。具体可以参考10.8节中给出的相应参考文献。 一个像太阳一样的常规星体靠着发生于其核心深处的核反应发光发亮,主要是将氢转换为氦。 由于星体总是在辐射能量,它需要核反应来弥补以维持静态。太阳会以一个相当稳定的速度在大概 1010 年内烧完它的氢。一个质量更大的星体,其核心会密度更大、温度更高以承受更高的质量,由 于核反应的速率敏感的依赖于温度和密度,只能维持约百万年的稳定。天文学家给这类稳定星体起 了个名字:他们叫它‘主序星’,因为在以表面温度和亮度为坐标的图上,它们全落在一个相当狭窄 的带上:一颗正常恒星的亮度和温度完全由其质量决定。 尽管如此,当核心中的全部氢都转换为氦之后,其能量之源便断掉了,星体的核心将随着其存 储能量的缓慢辐射而开始收缩。收缩过程实际上会加热核心!有趣的是,这意味着自引力系统具有 负热容:其随着失去能量而变得更热了。这样一个系统在热力学上式不稳定的,最后的结果是所有 星体都要么塌缩成一个黑洞、要么被其他非热力学作用支撑住,比如接下来要讨论的量子力学。 在最后,收缩着的核心温度越来越高,启动了由氦转换为碳和氧的反应,释放出更多的能量。 由于核反应堆温度的敏感性,星体的亮度会急速升高。为了应付这新的能流,星体的外层会膨胀, 星体将形成一种‘核心-光晕’结构。其表面一般会相当巨大,冷却到太阳表面温度以下,而不论核心 处的巨大温度。由于其表面的辐射光谱主要在红端,这样的星体被称为红巨星。红巨星的巨大亮度 会吹散构成其自身物质的相当一部分,使得总质量减小。这样强烈的恒星风据猜测形成了天文摄影 中一个受欢迎的主题, ‘行星状星云’ 。 最后星体耗尽了氦,接下来会发生什么取决于这个时候还有多少质量剩下。它可能会冷却并收 缩成一颗小质量的白矮星, 由量子力学的压强支撑着(见下) 。或者如果它的核心温度更高一点, 那 么可能会进入将碳转换为硅、硅转换为铁的过程。最后,由于56Fe 是最稳定的核素,所有的星体都 会耗尽它的能量——将铁转换为任何东西的过程都要吸收能量而不是放出。星体接下来的演化取 决于四件事:质量、转动、磁场和化学组分。 首先考虑缓慢旋转的星体,即转动对其结构没有太大的影响。一颗具有太阳质量或更小的星体 会慢慢的演化成白矮星。其压强并不来自于热效应,而是来自接下来要讨论的量子力学。对于像我 们太阳这样的相对低质量星体,问题在于其不存在足够强的引力场以克服量子效应或者在更早的 时期迅速收缩。一颗更高质量的星体也会经历氢燃烧的主序过程,但随后发生的事情现在还并没有 完全理解。如果星体位于一个双星系统之中的话,问题会更加复杂,在结束主序过程成为红巨星的 时候,它可能会给其同伴提供相当大一部分质量。如果一颗星体通过风或者送给它同伴的方式损失
  147. D raft T ranslation 146 CHAPTER 10. 星体的球对称解 了足够的质量,那么其后续演化跟我们对太阳的预期别无二致。但看起来并不是所有星体都遵循这 条路。在核循环的某个时刻,一颗质量足够大的星体核心处的量子力学压强不足以支撑它的重量,

    塌缩了。如果它不是那么重(初始质量大概在 15-20M⊙ ) ,核之间强烈的排斥力将在密度达到原子 核的密度之时中止塌缩。向内坠落的物质会‘反弹’并发射,形成壮丽的 II 类超新星爆发。 (但反弹 和部分坍缩的中物理并没有被很好的理解,即便我们已经体验过了——2008 年那次。 )留下的核形 成了随后将会学习的中子星。如果初始的星体质量还要更大一些的话,计算机模拟显示塌缩过程不 会反转,最后的结果便是黑洞,可能会伴随着类似的爆发,或者是 gamma 射线簇 (Wooseley and Bloom 2006)。这些被称为‘星体质量’的黑洞大概有 5 到 60M⊙ ,取决于其原本的星体。我们下一章 就会讨论,在我们的星系中已经在 X-射线双星系统中确定了大量这样的黑洞。 在引入了磁场和转动之后,图像会大大的不同,其也属于现在研究的课题。转动可以诱发能混 合内层和外层的流来改变主序过程。在塌缩过程中,由于塌缩核的角动量守恒,转动会变得更加重 要。但足够强的磁场可以将角动量从核心转移到星体的其他部分,以实现一个更加球对称的塌缩。 星体的组份也是一个关键点。现在形成的多数恒星被天文学家们归类为星族 I,其元素丰度和 太阳类似:由上一代恒星的超新星爆发产生的各种元素组成的气体云团形成。尽管如此,第一代恒 星(曾被称为星族 III)完全由宇宙大爆炸中产生的仅有元素——氢和氦组成(见第12章) 。这些 恒星可能曾具有大得多的质量(百倍于太阳质量) ,演化的非常快直到引力塌缩,可能提供了一部 分被天文学家们称作是中等质量黑洞(从 100M⊙ 到数千倍太阳质量,见 Miller and Colbert 2004) 的来源。 中等质量黑洞的名字源自其质量位于星体质量黑洞和多数常规星系中心的超大质量黑洞之间。 我们将在下一章中更详细的讨论这些东内容。 量子压强 现在我们给出对于支撑白矮星和中子星的力量的基础性讨论。考虑位于体积为 V 的盒子中的 一个电子。由于 Heisenberg 不确定性原理,其动量不确定度的数量级大约为 ∆p = hV 1/3, (10.73) 其中 h 为 Planck 常数。动量的模位于 p 到 p + ∆p 之间在动量空间中占有体积 4πp2dp。期间可以 放置尺度为 ∆p 的盒子这么多个 dN = 4πp2 dp/(∆p)3 = 4πp2 dp h3 V. (10.74) 由于电子的动量不能比 ∆p 更精确的确定,那么这就是体积为 V 的盒子中动量在 p 到 p + dp 之间 的状态数。由于电子是 Fermion,这便意味着它们具有奇特的形式——同一个态上不能同时占据两 个粒子。 (这是周期表的周期变化以及物质的固体性和相对不可入性的源头。 )电子自旋为 1 2 ,意味 着每个动量态都有对应的两个自旋态(‘自旋向上’和‘自旋向下’) ,那么总计有 V 8πp2 h3 dp (10.75) 个态,是体积 V 的盒子中动量在 p 到 p + dp 之间最大可能的电子数。 现在假设我们将电子气体充分的冷却,即将所有电子的能量尽可能的降低。若总共有 N 个电
  148. D raft T ranslation 10.7. 相对论性星体和引力塌缩 147 子,那么它们足够冷仅当它们填满了 p =

    0 到 p = pf 之间的全部动量态,pf 由下式给定 N V = ∫ pf 0 8πp2 h3 dp = 8πp3 f 3h3 . (10.76) 由于 N/V 是数密度,那么得到了冷电子气体所满足的关系 n = 8πp3 f 3h3 , pf = ( 3h3 8π )1/3 n1/3. (10.77) pf 被称为 Fermi 动量。注意其只取决于单位体积内的粒子数,而与其质量无关。 每个电子都具有质量 m 和能量 E = (p2 + m2)1/2。那么这样的气体中总能量密度为 ρ = E总 V = ∫ pf 0 8πp2 h3 (p2 + m2)1/2 dp (10.78) 由于我们处理的是一个封闭系统,在(4.22)式中取 ∆Q = 0 就可以求得压强 p = − d dV (E总) = −V 8πp2 f h3 (p2 f + m2)1/2 dpf dV − ρ. (10.79) 对于固定的粒子数 N,有 V dpf dV = −n dpf dn = 1 3 ( 3h3 8π )1/3 n1/3 = 1 3 pf , (10.80) 从而得到 p = V 8π h3 p3 f (p2 f + m2)1/2 − ρ. (10.81) 对于极端相对论气体,即 pf ≫ m(对应于气体被压缩到小的 V 的情况) ,我们有 ρ ≈ 2πp4 f h3 , (10.82) p ≈ 1 3 ρ. (10.83) 这就是‘冷’电子气体的状态方程。从而气体即便是在充分冷的时候也具有与其密度相当的压强。根 据4.10节中的练习 22,我们知道(10.83)式对于光子气体也成立。原因在于相对论性 Fermi 气体在 其能量远大于静止质量时表现得像光子气体一样——静止质量并不重要,去掉它基本不改变什么。 白矮星 当一颗寻常星体塌缩后,其会达到一个电子相对核自由的状态,从而我们有了两种气体:电子 气体与核气体。由于它们有同样的温度,那么每个粒子的平均能量都相同6,那么质量低的电子动 量也会更低。随着压缩的进行,Fermi 动量上升((10.77)式7) ,直到与电子的动量可以比拟。它们 相当于一团冷的电子气体,支撑了星体的压力。核的动量远远大于 pf ,因此它们是经典气体,只 能提供非常少的压强。在另一方面,核提供了大部分引力——中子和质子可比电子重得多。因此提 6译注:这个论据并不严格。 7译注:原文引用有误。
  149. D raft T ranslation 148 CHAPTER 10. 星体的球对称解 供 Newton

    引力(在此处已经够用了)的质量密度为 ρ = µmp ne , (10.84) 其中 µ 是核子数与电子数之比(大概是 1 到 2 的量级) ,mp 是质子质量,ne 是电子数密度。当电 子处在极端相对论情形时,整个气体的压强密度之间满足关系 p = kp4/3, k = 2π 3h2 ( 3h3 8πµmp )4/3 . (10.85) 星体的 Newton 结构方程为 dm dr = 4πr2ρ, dp dr = −ρ m r2 .    (10.86) 作为量级估计,有(式中 M 为星体质量、R 为半径、¯ ρ 为典型密度、¯ p 为典型压强) M = R3 ¯ ρ, ¯ p/R = ¯ ρM/R2.    (10.87) 据(10.85)式取8 ¯ p = h¯ ρ−4/3,得到 k¯ ρ1/3 = M R . (10.88) 利用(10.87)式,可消去 R,得到关于 M 的表达式 M = ( 3k3 4π )1/2 = 1 32µ2m2 p ( 6h3 π )1/2 . (10.89) 利用几何单位制,取 µ = 2,得到 M = 0.47 × 105 cm = 0.32M⊙ . (10.90) 从我们的推导中可以推测这大致是相对论性电子气体所能支撑的最大质量的量级,其引力来自于 非相对论性的冷核气体。这被称为 Chandrasekhar 极限,更准确的计算通过直接积分(10.86)式给 出 M ≈ 1.3M⊙ 。具有更高质量的任何星体不能被电子压强所支撑。实际上,这个上界还要更小一 些,大概在中心密度为1010 kg/m3,其源于接下来要讲到的不稳定性。 中子星 如果在白矮星的基础(大概是 ρ ≲ 1010 kg/m3)上将物质继续压缩,电子的动能会大到足以 和质子复合形成中子,多余的能量会通过中微子释出。那么压缩会使得提供压强的电子气体减少: 压强无法足够快的上升,从而星体是不稳定的。密度在达到1016 kg/m3的区域之前不存在稳定的星 体。在这个密度下,几乎所有的电子都与质子复合,形成了用以提供压强的中子气体。它们也是 Fermi 子,即它们遵从与电子完全相同的状态方程(10.81)和(10.83)。中子星和白矮星之间有两个区 8译注:原文有误。
  150. D raft T ranslation 10.8. 扩展阅读 149 别:首先,为了使 pf 达到中子典型的动量尺度,需要高得多的压强;其次,总能量密度现在由中

    子自己决定:现在不存在提供了更多额外引力的离子气体了。那么,这儿在高压缩状态下的总状态 方程为(10.83)式: p = 1 3 ρ. (10.91) 不幸的是,由于这儿必须使用完整的相对论结构方程((10.30)式和(10.39)式) ,没法通过简单的讨 论得到一个质量上界。 实际上,中子星物质是天文学家们所发现的最复杂最奇特的物质状态。中子星内部密度简并的 中子气体尽管温度相当高(106 K或更高) ,却表现出超流体的特性。中子与密度低得多的质子和电 子气体处在化学平衡态,其中质子表现出超导性!这个性质或许有助于理解为什么中子星具有与 其自转轴不平行的强大磁场,尽管具体关系仍未明了。在中子星内部,密度可能会相当高以至于中 子溶解为自由的 quark。计算这类条件下核物质的状态方程给核理论家们提出了相当巨大的挑战。 物理条件超出了实验室能够达到的极限,核力(强相互作用)的短程性和复杂性迫使物理学家们提 出一个又一个近似和假设以得到状态方程。现在提出了大把的状态方程,它们各自都指向了非常不 同的物理性质 (Lattimer and Prakash 2000)。不同的状态方程给出了中子星质量和半径之间不同 的关系,以及很不同的质量极限,分布在 1.5M⊙ 到大概 2.5M⊙ 之间。如果可以同时测量中子星 的质量和半径的话,许多疑难都可以迎刃而解。另外,如果我们有样本量足够大的中子星质量数据, 也可以得到一个置信度足够高的最大质量,这同样很有帮助。 中子星最初作为脉冲星被发现(前述数章中已经提到) ,尽管另外一些非脉冲的中子星是通过 其 X 射线或 γ 射线发射发现的。尽管星体演化和中子星形成之间的关系并没有完全理解,脉冲星 的研究说明多数中子星都是由超新星爆炸产生的。天文学家们已经能将一系列脉冲星和超新星遗 迹联系起来,其中包括已知最年轻的脉冲星,巨蟹星云中的 PSR B0531+21。对脉冲星运动的研究 发现,它们在诞生时会受到强烈的‘撞击’ ,获得大约400到1000 km/s的速度。比较起来,太阳绕银河 系中心的运动速度是200 km/s,而任意两颗星体之间的平均速度,大概是数十km/s的量级。撞击一 定源于引力塌缩以及接下来的初始爆炸中的某种不对称性。 从对中子星结构的理解来看,最有趣的脉冲星是双星系统中的那些,其轨道动力学至少让天文 学家们能测量其质量。现在已经有了许多准确的测量,表明它们主要集中在 1.4M⊙ 附近 (Loimer 2008, Stairs 2003);尽管某些星体有着更高到 2M⊙ 左右的质量。某些双星系统中的中子星是 X 射 线源,和黑洞一样的过程:源自其同伴的气体坠入其中。这会使星体获得非常高的转速。最快的脉 冲星是 PSR J1748-2446ad,其转速高达716 Hz! 原则上讲, 转动可以提高星体的质量上界 (Stergioulas 2003), 至少在转动导致的相对论性不稳 定出现之前是这样 (Friedman and Schutz 1978, Anderson et al 1999, Kokkotas and Schmidt 1999)。 实际上,这个效应可能不会允许一个高于 1.5 倍的质量比。 10.8 扩展阅读 我们对球坐标系的构造和许多其他教材中的类似,但这种方法并不特别系统化,不容易推广到 其他对称性。群论提供了一个更一般化的尝试。见 Stenfani et al. (2003)。 计算相较静态球对称度规更复杂的度规的 Riemann 张量和 Einstein 张量显然会消耗大量的时 间。一些现代的计算机代数系统,例如 Maple 或 Mathematica ,有一些可以自动完成这项任务的
  151. D raft T ranslation 150 CHAPTER 10. 星体的球对称解 包。最优雅的手算方法应该要看 Cartan

    的了,见 Misner et al. (1973)。 对球对称星体的完整讨论可见 Shapiro and Teukolsky (1983)。在求解星体解时我们要求了 g00 和 grr 在星体表面的连续性。对于表面上不连续性正确的‘连接条件’的完整讨论可见 Misner et al. (1973)。 文献中存在其他一些严格的可压缩解,见 Stefani et al. (2003)。 在核燃烧的不同状态下星体的演化是一个巨大的课题,天文学家们借助计算机模拟已经在此 上取得了巨大的进展。但仍然存在不少开放的问题,其中包括双星系统中星体的演化,此时其同伴 的相互作用成了一个问题。具体文献可以参考 Hansen et al. (2004) 和 Tayler (1994)。对 Fermi 气 体状态方程更严格的推导可见量子力学教材。阅读 Chandrasekhar (1957) 可以明白他的极限完整 的推导过程。也可参考 Shapiro and Teukolsky (1983)。 不稳定性会导致星体的中心密度在白矮星和中子星之间存在一个空缺,讨论参考 Harrison et al. (1965), Shapiro and Teukolsky (1983), 和 Zel’dovich and Novikov (1971)。关于脉冲星精彩故 事的综述,参见 Lyne and Smith (1998) 或 Lorimer and Kramer (2004)。人们认为黑洞形成的主 要来源是大质量星体核心的塌缩,这会产生 II 类超新星爆发。这类超新星可能成为引力辐射源。 更大质量的塌缩会产生被叫做骇新星 (hypernovae) 的玩意和 γ 射线簇。关于这个方向,Höflich et al. (2004) 是一个好的入门。如果想追踪近年来的最新进展,读者应当关注 Texas Symposium in Relativistic Astrophysics,两年一开的系列会议。其他超新星爆发源自白矮星塌缩但不生成中子星 的过程。我们会在第12章中以宇宙学的视角讨论 Ia 类超新星的动力学。 网络上有着大量关于中子星和黑洞的资料,也包括 X 射线的观测结果。读者可以在 Einstein 在线网站上找到一些大众中流行的文章: http://www.einstein-online.info/en/. 10.9 习题
  152. D raft T ranslation Chapter 12 宇宙学 12.1 宇宙学是什么? 大尺度上的宇宙

    宇宙学 (cosmology) 研究整个宇宙:宇宙的历史、演化、成分、动力学。宇宙学的首要研究目 的是理解宇宙的大尺度结构,但也为宇宙从大爆炸 (the Big Bang) 开始膨胀以来所有更小尺度的 结构——星系、恒星、行星、人类——提供了背景与出发点。因此,宇宙学与其他学科(例如天文 学的其它分支、物理学、生物学)的交叉是一片富饶的科研领域。此外,随着天文学家能够详细研 究大爆炸的证据,宇宙学从而可以解释一些非常基本的物理问题:在可能范围内最大能量下的物 理规律是什么、大爆炸是怎样发生的、大爆炸之前是什么、构成物质的基本成分(如电子质子中子) 是怎样产生的。最后,自然界中所有系统与结构的起源都可以追溯到宇宙学的某些方面,甚至统治 自然界的物理定律的起源也有可能这样。 人们对宇宙大尺度结构的理解,根本上依赖于广义相对论。这一点不难说明。粗略地说,牛顿 理论在系统质量 M 与其尺度 R 相比很小(即 M/R ≪ 1)的时候可以很好地描述引力。当系统的 M/R 大到接近 1 的时候,必须用 GR 代替牛顿理论。后者对应的一种情况是,系统的半径 R 变 小的速度大于质量 M 变小的速度,也就是致密或塌缩的系统:中子星、黑洞的半径与它们的质量 相比十分小。另一种情况是,系统质量的增长速度比半径的增长速度快——这就是宇宙学的情形: 如果空间各处的质量密度大致是均匀的,那么随着我们考虑 R 越来越大的系统,质量按 R3 增长, 而 M/R 因而越来越大,必须采用 GR 处理。 大到什么尺度必须要用 GR 呢?我们从太阳的中心出发考虑半径 R 越来越大的球状系统。太 阳是非相对论性的,一旦 R 大于 R⊙ ,则 M 随着半径的增长几乎不变——直到半径增大到遇见下 一个恒星。太阳的上级系统——星系,一般含有 1011 个恒星,半径量级为 15 kpc。 (1pc,也就是 1 秒差距 (parsec, 缩写为 pc),等于 3 × 1016 m。 )星系的 M/R ∼ 10−6,和太阳差不多。因此星系 动力学也不需要相对论。 (这只对星系整体成立,星系中心附近的小区域可能由黑洞或其它相对论 性天体主导。 )人们观测到星系组成了星系团,星系团通常在 Mpc 尺度的区域内含有数千个星系, 星系团的 M/R ∼ 10−4,仍然不需要相对论就可很好地描述。 然而,当考虑比典型星系团更大的尺度时,我们就进入了宇宙学的领域。 在宇宙学的图景中, 星系甚至星系团都是非常小尺度的结构, 就像组成宽广宇宙的原子。 人类的 望远镜可以看到比 10 Gpc 更远的距离。在这种大尺度上观测到的宇宙是均匀的 (homogeneous), 153
  153. D raft T ranslation 154 CHAPTER 12. 宇宙学 各处的星系密度大致相同,星系类型几乎一致。后面会看到,平均的质量-能量密度大致为 ρ

    = 10−26 kg m−3。这一密度下,质量 M = 4πρR3/3 与 R 相等的尺度为 R ∼ 6 Gpc,在可观测宇宙的 范围内。因此,为了理解望远镜观测到的宇宙,需要用到广义相对论。 实际上,广相是科学家用来研究宇宙学的第一个自洽的理论框架。存在着合适度规来描述人们 观测到的均匀宇宙:这个宇宙没有边界 (boundry)、没有边缘 (edge)、处处均匀。牛顿引力无法自 洽地描述这种模型,因为牛顿理论的基本方程 ∇2Φ = 4πGρ 的解在没有边界、也就没有微分方程 边界条件的情况下是糊涂的。因此只有在爱因斯坦理论的框架下,宇宙学才能成为物理学与天文学 的分支。 下面考虑逆向的问题:在一个全体结构都是高度相对论性的宇宙中: • 研究宇宙的局域部分可以不考虑宇宙学吗? • 在前几章应用广义相对论研究中子星和黑洞的时候,可以假设它们嵌在空的渐近平直时空当 中,如果它们在高度相对论性的宇宙里,还可以像前几章那样假设吗? • 天文学家研究单个恒星、地质学家研究单个行星、生物学家研究单个细胞——都可以不考虑 广相吗? 答案是“可以”,因为广相的时空是局域平直的:只要实验限制在局域范围内,就不需要考虑大尺度 的几何。在牛顿理论中,这种整体与局域分离的性质不成立。根据牛顿理论,一个大尺度的、密度 均匀的系统,即使是其局部引力场也依赖于远处的边界条件,依赖于遥远的宇宙“边缘”的形状(见 本章习题 3) 。因此广相不仅使我们可以研究宇宙学,并且它还解释了为啥其它学科可以不考虑广 相! 宇宙舞台 近年来,随着地面与空间天文观测的进步,宇宙学已经成为了一门精确科学,可以回答一些 最基本的物理问题。在大尺度——平均在大于 10 Mpc 的尺度上观测到的宇宙基本图景是相当简单 的:均匀的宇宙以处处相同的速率膨胀。宇宙也是各向同性的 (isotropic):人们在各个方向观测 到的宇宙平均而言都相同。宇宙布满了具有黑体热谱的辐射(温度为 2.725 K) 。宇宙在膨胀意味 着宇宙的年龄有限,至少宇宙是从密度非常高的状态经有限长的时间膨胀来的。热辐射意味着宇宙 早期比现在热得多,宇宙随着膨胀而越来越冷。膨胀解决了最古老的宇宙学难题——Olbers 佯谬。 夜空之所以是黑的,是因为我们不会接收到无限大的均匀宇宙中所有恒星发射的光,而只会收到距 离足够近、发出的光可以在宇宙年龄之间到达地球的恒星。 不过,膨胀又引起了其它深刻的问题: • 宇宙是怎样演化到当前状态的?更早时候的宇宙是什么样子? • 第一颗恒星是如何形成的,为啥恒星成团组成星系,为啥星系也成团?小于 10 Mpc 的尺度 上有各种各样的宇宙结构,造成这些结构的密度涨落是怎样产生的? • 元素是怎样形成的,在高温高密度、一般的原子核无法存在的早期,宇宙是什么样的?非常 热的早期宇宙可以告诉我们一些更高能标(比粒子加速器还高)的物理学吗? • 观测到的宇宙均匀性与各向同性能否用物理解释? 对这些问题的研究促使物理学家探索一些基础物理学前沿的深刻问题。均匀性问题可以通过 假设早期宇宙以指数型的速度快速膨胀(物理学称之为暴胀 (inflation))加以解决。如果实验室 可达到的高能标的物理规律有适当的形式,那么这个假设就成立,如果它成立,那么还能额外解释 形成星系与星系团的密度涨落。后面会看到,宇宙中的大部分物质似乎都是未知的,物理学家称之
  154. D raft T ranslation 12.2. 宇宙运动学:观测膨胀宇宙 155 为暗物质 (dark matter),因为它不发光(电磁辐射)

    。更奇特的是,宇宙似乎弥漫着一种相对论 性的能量密度,它具有负压强,使宇宙膨胀的越来越快;物理学家称之为暗能量 (dark energy)。 暗能量与暴胀之谜也许只有在更好地研究高能物理规律之后才能解决,因此理论物理学家正越来 越盼望着从天文学中找到发展理论的线索。 现代宇宙学早已回答了这些问题中的一部分,并且这些答案越来越精确、明晰。本章是当前 (2008 年) 对基本问题的理解的快照。与本书涉及的其他领域不同,未来宇宙学的研究很可能有着 新见解 (insights)、新惊奇 (surprises)、甚至是一场新革命 (revolution)。 12.2 宇宙运动学:观测膨胀宇宙 在开始讨论宇宙学的深刻问题及其答案之前,我们首先得能够描述、处理宇宙膨胀的概念。本 节会详述描述均匀膨胀宇宙的度规,说明天文观测如何测量膨胀的历史,并且建立在膨胀宇宙中讨 论物理过程的基本框架。12.3,也就是下一节会把爱因斯坦方程应用于这个模型,从而看到广相告 诉我们宇宙是怎样膨胀的。 宇宙的均匀性与各向同性 将广相应用于宇宙学的最简单方法是利用宇宙在大尺度上均匀的这一观测事实在远大于 10 Mpc 的尺度上,均匀的不只有平均密度,其它性质也是均匀的:例如星系的类型、成团密度、化学成分 以及恒星成分。当然,观测很远的地方也是在回顾过去,因为光传播到地球需要一定时间;回顾很 远的过去,我们也会观测到宇宙演化,观测到宇宙更年轻的时候。人们观测到的宇宙演化也是在各 个方向都相同的,即使对于在宇宙早期相距很远的两个地方也是如此。综上可以推论,宇宙在大尺 度上是均匀的 (homogeneous)。此外,在远大于 10 Mpc 的尺度上,宇宙关于各点是各向同性的 (isotropic):没有观测到特殊方向。1 可观测宇宙的第三个特征是均匀膨胀:平均而言, 星系远离地球的退行速度正比于到地球的距 离。这个退行速度称为哈勃流 (Hubble flow),以纪念它的发现者埃德温 哈勃 (Edwin Hubble)。 这种膨胀可以用“气球”模型简单地说明(如图12.1) 。气球上画有规则分布的点,让气球膨胀,随着 气球膨胀,表面上任意两点的相对速率正比于它们的距离。因此任意点都会看到其它点以正比于距 离的速度远离。正比关系保证了气球上的点在随时间变化的过程(膨胀)中仍然是均匀的。这意味 着地球在宇宙的位置并非特殊的,即使人们观测到所有天体在远离地球,人类并非位于膨胀宇宙的 中心。哈勃流与哥白尼原理 (Copernican Principle)(宇宙并非绕地球转动或以地球为中心向外 膨胀)相一致。 哈勃膨胀会产生另一种各向异性的可能。例如,一个均匀各向同性的宇宙,其中每一点观测到 的 x 方向的退行速度可以比 y 方向大。就像椭球形气球的膨胀那样,为了保持形状,长轴的膨胀 速率要比其它方向快。我们的宇宙没有观测到任何速度的各向异性。由于这种极度的简单性,距离 与退行速度的关系用比例常量 H 即可描述: v = Hd. (12.1) 1宇宙可以是均匀但不各向同性的,例如,如果在大尺度上存在匀强磁场(各点的磁场大小、方向均相同) 。另一方面,一 个不均匀的宇宙不可能关于各点都各向同性,因为这种宇宙的绝大部分(如果不是全部)都会观测到在天空的某一方向“成 团”而另一方向并非如此。
  155. D raft T ranslation 156 CHAPTER 12. 宇宙学 图 12.1:

    随着图中的气球膨胀,各点之间的相对距离的增大速率正比于距离大小。 天文学家把 H 称为哈勃参量 (Hubble’s parameter),它在现在的值称为哈勃常量 (Hub- ble’s constant),记作 H0 。H0 的测量值(测量方法在下文讲述)为 H0 = (71 ± 4) km s−1 Mpc−1, 这个奇怪的单位是天文学家为了方便而采用的。为了将这个值转换为常见单位,利用 1 Mpc = 3.1 × 1022 m,可得 H0 = (2.3 ± 0.1) × 10−18 s−1。在几何单位制下,found by dividing by c, H0 = (7.7 ± 0.4) × 10−27 m−1。与哈勃常数相应的是哈勃时间 tH = H−1 0 = (4.3 ± 0.2) × 1017 s,大 约是 140 亿年,这就是宇宙膨胀的时间尺度。它并非精确的宇宙的年龄,因为膨胀速度一直在变, 但它给出了宇宙演化时间的量级。 你第一次看到上面的讨论时, 也许是拒绝的, 因为忽略了同时的相对论性。 如果宇宙随时间变化 ——在膨胀,那么有可能找到某些时间的定义从而使得等时超曲面是均匀各向同性的,但是对其它 的时间坐标的不成立。 此外, 方程(12.1)不可能是确切的, 至少因为对于 d > 1.3×1026 m = 4200 Mpc, 退行速度超过了光速!这一看法的双方都对。我们的讨论是局域的(只讨论退行速度远小于 1 的 区域) ,并且只采用一种特定的观测者——我们自己的观点。幸运的是,宇宙膨胀的比较慢,因此 讨论的区域有 1000 Mpc 的量级那么大, 这个尺度足够大, 可以在这个尺度上研究宇宙的平均性质。 此外,星系相对于它近邻的平均随机速度一般小于 100 km s−1,是高度非相对论性的,并且远小于 宇观距离尺度上的哈勃膨胀速度。 因此,正确的相对论性描述宇宙膨胀的方法是,在我们的附近存在着特别的时间坐标,其等时 超曲面是均匀各向同性的。and with respect to which Eq. (12.1) is valid in the local inertial frame of any observer who is at rest with respect to these hypersurfaces at any location. 乍看起来, 存在着特殊的宇宙学参考系是很奇怪的:狭义相对论不正是说明了没有特殊参考系 吗?实际上并不冲突:物理学定律本身不随观测者的改变而变化。但是宇宙只有一个,这个宇宙的 物理结构使得可以定义一种便利的参考系。就像在研究太阳系的时候把时空的原点定在木星、1900 年 1 月 1 日是不合适的那样,宇宙学理论不采用体现宇宙大尺度均匀性的参考系也是鱼唇的。因 此,从这儿开始,我们在这种宇宙学参考系、特别定义的时间当中讨论问题。 宇宙的模型:宇宙学原理 要建立宇宙大尺度结构的模型,就必须对十分遥远、发出的光不可能被望远镜观测到的区域进 行假设。这里应该对宇宙中的两种不可能观测到的区域进行区分。
  156. D raft T ranslation 12.3. 宇宙动力学:理解膨胀宇宙 157 图 12.2: 时空图:宇宙过去的历史(回溯到

    t = 0)图示。 “未知”区域没有时间向我们传递信息; “未观测”区域被信息源到地球之间的中 间介质给模糊掉了。 第一种禁区是距离我们太远,以至于不可能有信息(即使沿类光测地线)到达我们这儿,无论 信息发出的多早。这种区域位于我们的过去光锥以外,如果宇宙的年龄有限,那么就存在这种区域, 宇宙年龄的确有限(如图12.2) 。 “未知 (unknown)”区域在一方面上是不重要的:那里究竟发生了啥 对我们的过去光锥没有影响,因此宇宙模型假设它发生了什么对模型的可观测部分没有影响。另一 方面,我们的过去光锥是一种视界 (horizon),称为粒子视界 (particle horizon):随着时间流逝, 越来越多之前未知的区域进入过去光锥的边界变成可观测的。因此穿过粒子视界的未知区域可以 对我们的未来产生实在的影响。在这个意义上,宇宙学是回顾过去的科学:她只会让我们可靠地理 解过去。 不过, 必须指出, 如果观测发现明天到达、来自于昨天的“未知”区域的信息竟然与 (先前的) 可 观测宇宙非常不同,比如说是高度非均匀的,则历史上的这个时刻的特殊性在物理与哲学上都很 难解释。避免这一难题的办法通常是假设未知区域和观测到的一样是均匀各向同性的。注意,这个 假设是很有理由的。考虑图12.2,两个设想的观测者具有两个过去光锥,在宇宙早期他们的光锥不 相交,也就是他们互相在彼此的粒子视界之外。但是可以发现,他们各自附近的物理环境是很相似 的: 未完成 宇宙度规 三种宇宙 宇宙学红移作为一种距离的度量 宇宙结构学:宇宙中的距离的测量 宇宙在加速! 12.3 宇宙动力学:理解膨胀宇宙
  157. D raft T ranslation 参考文献 Abraham, R. & Marsden, J.

    E. (1978) Foundations of Mechanics, 2nd edn (Benjamin/Cummings, Reading, Mass.). Adler, R., Bazin, M., & Schiffer, M. (1975) Introduction to General Relativity, 2nd edn (McGraw-Hill, New York). Alcubierre, M. (2008) Introduction to 3+1 Numerical Relativity (Oxford University Press, Oxford). Allen, S. W., Schmidt, R. W., & Fabian, A. C. (2002) Mon. Not. Roy. Astron. Soc., 334, L11. Andersson, N., Kokkotas, K.D., & Schutz, B.F. (1999) Astrophys. J., 510, 846–853. Andréasson, H. (2005) ‘The Einstein–Vlasov system/kinetic theory’, Living Rev. Relativity, 8, 2. URL: http://www. livingreviews.org/lrr-2005-2 Ansorg, M. (2005) Phys. Rev., D72, 024019. Armstrong, J. W. (2006) ‘Low-frequency gravitational wave searches using spacecraft doppler Tracking’, Living Rev. Relativity, 9, 1. URL: http://www.livingreviews.org/lrr-2006-1 Arzeliès, H. (1966) Relativistic Kinematics (Pergamon Press, London). Translation of a 1955 French edn. Ashby, N. (2003) ‘Relativity in the global positioning system’, Living Rev. Relativity, 6, 1. URL: http://www. livingreviews.org/lrr-2003-1 Ashtekar, A. & Bojowald, M. (2006) Class. Q. Grav., 23, 391. Balian, R., Audouze, J., & Schramm, D. N. (1980) Physical Cosmology. Proceedings of 1979 Les Houches summer school (North-Holland, Amsterdam). Barrow, J. & Tipler, F. (1986) The Anthropic Cosmological Principle (Oxford University Press, Oxford). Bekenstein, J. D. (1973) Phys. Rev. D, 7, 2333–2346. Bekenstein, J. D. (1974) Phys. Rev. D, 9, 3292–3300. Berger, B. K. (2002) ‘Numerical approaches to spacetime singularities’, Living Rev. Relativity, 5, 1. URL: http: //www.livingreviews.org/lrr-2002-1 Beyer, H. R. (2001) Comm. Math. Phys., 221, 659–676. Birrell, N. D. & Davies, P. C. W. (1984) Quantum Fields in Curved Space (Cambridge University Press, Cambridge). Bishop, R. L. & Goldberg, S. I. (1981) Tensor Analysis on Manifolds (Dover, New York). Blair, D. (1991) The Detection of Gravitational Waves (Cambridge). Blanchet, L. (2006) ‘Gravitational radiation from post-Newtonian sources and inspiralling compact binaries’, Living Rev. Relativity, 9, 4. URL: http://www.livingreviews.org/lrr-2006-4 Blandford, R. D. & Znajek, R. L. (1977) Mon. Not. Roy. astr. Soc., 179 433–456. Bohm, D. (2008) The Special Theory of Relativity, new edition with preface by J. Barrow (Routledge, New York). Bojowald, M. (2005) ‘Loop quantum cosmology’, Living Rev. Relativity, 8, 11. URL: http://www.livingreviews.org/ lrr-2005-11 Bona, C. & Palenzuela-Luque, C. (2005) Elements of Numerical Relativity (Springer, Berlin). Boriakoff, V., Ferguson, D. C., Haugan, M. P., Terzian, Y., & Teukolsky, S. A. (1982) Astrophys. J., 261, L101. Bourne, D. E. & Kendall, P. C. (1992) Vector Analysis and Cartesian Tensors 3rd edn (CRC Press, New York). Brenneman, L. & Reynolds, C. (2006) Astrophys. J., 652 1028. Buchdahl, H. A. (1959) Phys. Rev., 116, 1027. Buchdahl, H. A. (1981) Seventeen Simple Lectures on General Relativity Theory (Wiley, New York). Butterworth, E. M. & Ipser, J. R. (1976) Astrophys. J., 204, 200. Campanelli, M., Lousto, C. O., Zlochower, Y., & Merritt, D. (2007) Phys. Rev. Lett., 98, 231102. Carroll, S. (2003) Spacetime and Geometry (Benjamin Cummings). Cartan, E. (1923) Ann. Ecole Norm. Sup., 40, 325. Carter, B. (1969) J. Math. Phys., 10, 70. Carter, B. (1973) In DeWitt, B. & De Witt, C. (eds.). Black Holes (Gordon and Breach, New York). 161
  158. D raft T ranslation Carter, B. (1979) ‘The general theory

    of the mechanical, electromagnetic, and thermodynamic properties of black holes’ . In Hawking & Israel (1979), p. 294. Caves, C. M., Thorne, K. S., Drever, R. W. P., Sandberg, V. D., & Zimmerman, M. (1980) Rev. Mod. Phys., 52, 341. Chandrasekhar, S. (1957) Stellar Structure (Dover, New York). Chandrasekhar, S. (1980) In Wayman, P., Highlights of Astronomy (Reidel, Dordrecht).Proceedings of the 1979 IAU meeting in Montreal, p. 45. Chandrasekhar, S. (1983) The Mathematical Theory of Black Holes (Oxford University Press). Chandrasekhar, S. (1987) Truth and Beauty (University of Chicago Press, Chicago). Choquet-Bruhat, Y., DeWitt-Morette, C., & Dillard-Bleick, M. (1977) Analysis, Manifolds, and Physics (North- Holland, Amsterdam). Choquet-Bruhat, Y. & York, J. W. (1980) ‘The Cauchy problem’. In Held (1980a), p. 99. Ciufolini, I., Pavlis, E. C., & Peron, R. (2006) New Astronomy, 11, 527–550. Comins, N. & Schutz, B. F. (1978) Proc. Roy. Soc. A, 364, 211. Cook, G. (2000) ‘Initial Data for Numerical Relativity’, Living Rev. Relativity, 3, 5. URL: http://www.livingreviews. org/lrr-2000-5 Cordes, J. M., Kramer, M., Lazio, T. J. W., et al. (2004) New Astr. Rev., 48, 1413–1438. Damour, T. (1987) ‘The problem of motion in Newtonian and Einsteinian gravity’, in S. Hawking and W. Israel (eds.), 300 Years of Gravitation (Cambridge), 128–198. Damour, T. & Dervelle, N. (1986) Ann. Inst. Henri Poincare 44, 263–292. DeWitt, B. S. (1979) ‘Quantum gravity: the new synthesis’. In Hawking & Israel (1979), p. 680. Dicke, R. H. (1964) In Dewitt, B. & Dewitt, C. Relativity, Groups and Topology (Gordon and Breach, New York). Lectures at the 1963 Les Houches summer school. Dixon, W. G. (1978) Special Relativity: The Foundation of Macroscopic Physics (Cambridge University Press, Cam- bridge). Ehlers, J., and Kundt, W. (1962), in Witten, L., ed., Gravitation: An Introduction to Current Research (Wiley, New York), pp. 49–101. Fermi, E. (1956) Thermodynamics (Dover, New York). Filippenko, A. (2008) Dark Energy and Supernovae (Princeton University Press, Princeton). French, A. P. (1968) Special Relativity (W. W. Norton, New York). Friedman, J. L. (1978) Commun. Math. Phys., 63, 243. Friedman, J. L. & Schutz, B. F. (1978) Astrophys. J., 222, 281. Futamase, T. (1983) Phys. Rev. D, 28, 2373. Futamase, T. & Itoh, Y. (2007), Living Rev. Relativity, 10, 2. URL: http://www.livingreviews.org/lrr-2007-2 Futamase, T. & Schutz, B. F. (1983) Phys. Rev. D, 28, 2363. Genzel, R. & Karas, V. (2007) in V. Karas and G. Matt (eds.) Black Holes (Cambridge University Press, Cambridge), pp. 173–180. Geroch, R. (1978) General Relativity from A to B (University of Chicago Press). Geroch, R. & Horowitz, G. T. (1979) ‘Global structure of spacetimes’. In Hawking & Israel (1979), p. 212. Glendenning, N. K. (2007) Special and General Relativity: With Applications to White Dwarfs, Neutron Stars and Black Holes (Springer, New York). Gron, O. & Hervik, S. (2007) Einstein’s General Theory of Relativity: With Modern Applications in Cosmology (Springer, New York). Guth, A. (1981) Phys. Rev. D, 23, 347. Hagedorn, R. (1963) Relativistic Kinematics (Benjamin, New York). Hansen, C. J., Kawaler, S. D., & Trimble, V. (2004) Stellar Interiors –Physical Principles, Structure, and Evolution (Springer-Verlag, New York). Harrison, B. K., Thorne, K. S., Wakano, M., & Wheeler, J. A. (1965) Gravitation Theory and Gravitational Collapse (University of Chicago Press). Hartle, J. B. (2003) Gravity: An Introduction to Einstein’s General Relativity (Benjamin Cummings). Hawking, S. W. (1972) Commun. Math. Phys., 25, 152. Hawking, S. W. (1975) Commun. Math. Phys., 43, 199. Hawking, S. W. & Ellis, G. F. R. (1973) The Large-Scale Structure of Space–Time (Cambridge University Press, Cambridge).
  159. D raft T ranslation Hawking, S. W. & Israel, W.

    (1979) General Relativity: An Einstein Centenary Survey (Cambridge University Press, Cambridge). Heidmann, J. (1980) Relativistic Cosmology (Springer, Berlin). Held, A. (1980a) General Relativity and Gravitation (Plenum, London), vol. 1. Held, A. (1980b) General Relativity and Gravitation (Plenum, London), vol. 2. Hermann, R. (1968) Differential Geometry and the Calculus of Variations (Academic Press, New York). Hicks, N. J. (1965) Notes on Differential Geometry (D. Van Nostrand, New York). Heusler,M.(1998)‘Stationaryblackholes:uniquenessandbeyond’, LivingRev.Relativity, 1, 6. URL: http://www.livingreviews. org/lrr-1998-6 Hobson, M. P., Efstathiou, G. P., & Lasenby, A. N. (2006) General Relativity: An Introduction for Physicists (Cam- bridge University Press, Cambridge). Hoffmann, B. (1983) Relativity and Its Roots (Dover, New York). Höflich, P., Kumar, P., & Wheeler, J. C. (2004) Cosmic Explosions in Three Dimensions: Asymmetries in Supernovae and Gamma-Ray Bursts (Cambridge University Press, Cambridge). Hough, J. L. and Rowan, S. (2000) ‘Gravitational wave detection by interferometry (ground and space)’, Living Rev. Relativity, 3, 3. URL: http://www.livingreviews.org/lrr-2000-3 Hulse, R. A. and Taylor, J. H. (1975) ‘Discovery of a pulsar in a binary system’, Astrophys. J., 195, L51–L53. Isham, C. J. (1999) Modern Differential Geometry for Physicists (World Scientific, Singapore). Israel, W. & Stewart, J. (1980) ‘Progress in relativistic thermodynamics and electrodynamics of continuous media’. In Held (1980), p. 491. Jackson, J. D. (1975) Classical Electrodynamics (Wiley, New York). Kilmister, C. W. (1970) Special Theory of Relativity (Pergamon, Oxford). Knop, R.A. et al. (2003) Astrophys. J., 598, 102. Kobayashi, S. & Nomizu, K. (1963) Foundations of Differential Geometry (Interscience, New York), vol. I. Kobayashi, S. & Nomizu, K. (1969) Foundations of Differential Geometry (Interscience, New York), vol II. Kokkotas, K. D. & Schmidt, B. (1999) ‘Quasi-normal modes of stars and black holes’, Living Rev. Relativity, 2, 2. URL: http://www.livingreviews.org/lrr-1999-2 Komossa, S., Zhou, H., & Lu, H. (2008) ‘A recoiling supermassive black hole in the quasar SDSS J092712.65+294344.0?’ , Astrophys. J. Lett., 678, L81–L84. Kramer, M. et al. (2006) Science, 314, 97–102. Landau, L. D. & Lifshitz, E. M. (1959) Fluid Mechanics (Pergamon, Oxford). Landau,L.D.&Lifshitz,E.M.(1962)TheClassicalTheoryofFields(Pergamon,Oxford). Lattimer, J. M. & Prakash, M. (2000) ‘Nuclear matter and its role in supernovae, neutron stars and compact object binary mergers’, Phys. Rep., 333 121–146. Liang, E. P. T. & Sachs, R. K. (1980) ‘Cosmology’. In Held (1980b), p. 329. Liddle, A. (2003) An Introduction to Modern Cosmology, 2nd. edn (Wiley, New York). Lightman, A. P., Press, W. H., Price, R. H., & Teukolsky, S. A. (1975) Problem Book inRelativity and Gravitation (Princeton University Press, Princeton). Linde, A. (1982) Phys. Lett., 108B, 389. Lorimer, D. R. (2008) ‘Binary and millisecond pulsars’, Living Rev. Relativity, 11, 8. URL: http://www.livingreviews. org/lrr-2008-8 Lorimer, D. R. & Kramer, M. (2004) Handbook of Pulsar Astronomy (Cambridge University Press, Cambridge). Lovelock, D. & Rund, H. (1990) Tensors, Differential Forms, and Variational Principles (Dover, New York). Lyne, A.G. & Smith, F. G. (1998) Pulsar Astronomy (Cambridge University Press, Cambridge). Maartens, R. (2004) ‘Brane–world gravity’, Living Rev. Relativity, 7, 7. URL: http://www.livingreviews.org/ lrr-2004-7 MacCallum, M. A. H. (1979) ‘Anisotropic and inhomogeneous relativistic cosmologies’. In Hawking & Israel (1979), p. 533. Mathews, J. & Walker, R. L. (1965) Mathematical Methods of Physics (Benjamin, New York). McCrea, W. H. (1979), Q. J. Roy. Astron. Soc., 20, 251. Marder, L. (1971) Time and the Space-Traveller (George Allen & Unwin, London). Mermin, N. D. (1989) Space and Time in Special Relativity (Waveland Press, Illinois).
  160. D raft T ranslation Merritt, D. and Milosavljevic, M. (2005)

    ‘Massive black hole binary evolution’, Living Rev. Relativity, 8, 8. URL: http://www.livingreviews.org/lrr-2005-8 Miller, M. C. & Colbert, E. J. M. (2004) Int. J. Mod. Phys., D13, 1–64. Misner, C. W., Thorne, K. S., & Wheeler, J. A. (1973) Gravitation (Freeman, San Francisco). Møller, C. (1972) The Theory of Relativity (Clarendon Press, Oxford). Mukhanov, V. (2005) Physical Foundations of Cosmology (Cambridge University Press, Cambridge). Pais, A. (1982) ‘Subtle is the Lord...’, The Science and the Life of Albert Einstein (Oxford University Press, Oxford). Peebles, P. J. E. (1980) Large Scale Structure of the Universe (Princeton University Press). Penrose, R. (1969), Rev. Nuovo Cimento 1, 252. Penrose, R. (1979) In Hawking & Israel (1979), 581. Penzias, A. A. (1979) Rev. Mod. Phys., 51, 425. Perlick, V. (2004) ‘Gravitational lensing from a spacetime perspective’, Living Rev. Relativity, 7, 9. URL: http: //www.livingreviews.org/lrr-2004-9 Perlmutter, S., Aldering, G., Goldhaber, G., Knop, R.A., Nugent, P., Castro, P.G., Deustua, S., Fabbro, S., Goobar, A., Groom, D., Hook, I.M., Kim, A.G., Kim, M.Y., Lee, J.C., Nunes, N.J., Pain, R., Pennypacker, C.R., Quimby, R., Lidman, C., Ellis, R.S., Irwin, M., McMahon, R.G., Ruiz-Lapuente, P., Walton, N., Schaefer, B., Boyle, B.J., Filippenko, A.V., Matheson, T., Fruchter, A.S., Panagia, N., Newberg, H.J.M., and Couch, W.J., (1999), Astrophys. J., 517, 565–586. Peters, P. C. (1964) Phys. Rev., B 136, 1224. Pound, R. V. & Rebka, G. A. (1960) Phys. Rev. Lett., 4, 337. Pound, R. V. & Snider, J. L. (1965) Phys. Rev., B 140, 788. Price, R. H. (1972a) Phys. Rev. D, 5, 2419. Price, R. H. (1972b) Phys. Rev. D, 5, 2439. Rendall, A. D. (2005) ‘Theorems on existence and global dynamics for the Einstein equations’, Living Rev. Relativity, 8, 6. URL: http://www.livingreviews.org/lrr-2005-6 Renn, J. ed. (2007) The Genesis of General Relativity: Sources and Interpretations (Springer, 4 vols). Riess, A.G., Filippenko, A.V., Challis, P., Clocchiatti, A., Diercks, A., Garnavich, P.M., Gilliland, R.L., Hogan, C.J., Jha, S., Kirshner, R.P., Leibundgut, B., Phillips, M.M., Reiss, D., Schmidt, B.P., Schommer, R.A., Smith, R.C., Spyromilio, J., Stubbs, C., Suntzeff, N.B., and Tonry, J. (1998) Astron. J., 116, 1009–1038. Rindler, W. (1991) Introduction to Special Relativity, 2nd edn. (Oxford University Press, Oxford). Rindler, W. (2006) Relativity: Special, General, Cosmological, 2nd edn. (Oxford University Press, Oxford). Robinson, D. C. (1975) Phys. Rev. Lett., 34, 905. Rovelli, C. (2004) Quantum Gravity (Cambridge University Press, Cambridge). Ryan, M. P. & Shepley, L. C. (1975) Homogeneous Relativistic Cosmologies (Princeton University Press). Saulson, P. (1994) Funamentals of Interferometric Gravitational Wave Detectors (World Scientific). Schild, A. (1967) In Ehlers, J. (ed.), Relativity Theory and Astrophysics: I. Relativity and Cosmology (American Math. Soc., Providence, R.I.). Schneider, P. (2006) Extragalactic Astronomy and Cosmology (Springer-Verlag, Berlin). Schneider, P., Ehlers, J., Falco, E. (1992) Gravitational Lenses (Springer-Verlag, Berlin). Schouten, J. A. (1990) Tensor Analysis for Physicists (Dover, New York). Schrödinger, E. (1950) Space-Time Structure (Cambridge University Press, Cambridge). Schutz, B. F. (1980a) Phys. Rev., D 22, 249. Schutz, B. F. (1980b) Geometrical Methods of Mathematical Physics (Cambridge University Press, Cambridge). Schutz, B. F. (1984) Am. J. Phys., 52, 412. Schutz, B. F. (1986) Nature, 323, 310–311. Schutz, B. F. (2003) Gravity from the Ground Up (Cambridge University Press, Cambridge). Schutz, B. F. & Ricci, F. (2001) in I. Ciufolini, et al. (eds.) Gravitational Waves (Inst. of Phys., Bristol), pp. 11–83. Schwarz, P. M. & Schwarz, J. H. (2004) Special Relativity: From Einstein to Strings (Cambridge University Press, Cambridge). Shapiro, I. I. (1980) ‘Experimental tests of the general theory of relativity’. In Held (1980b), p. 469. Shapiro, S. L. & Teukolsky, S. A. (1983) Black Holes, White Dwarfs, and Neutron Stars (Wiley, New York). Smarr, L. L. (ed.) (1979) Sources of Gravitational Radiation (Cambridge University Press, Cambridge). Spergel, D. N. et al (2003) Astrophys. J. Suppl., 148 175. Spivak, M. (1979) A Comprehensive Introduction to Differential Geometry, (Publish or Perish, Boston), vols. 1–5.
  161. D raft T ranslation Stairs, I. H. (2003) ‘Testing general

    relativity with pulsar timing’, Living Rev. Relativity, 6, 5. URL: http://www. livingreviews.org/lrr-2003-5 Starobinsky, A. (1980) Phys. Lett., 91B, 99. Stephani, H. (2004) Relativity: An Introduction to Special and General Relativity, 3rd edn (Cambridge University Press, Cambridge). Stephani, H., Kramer, D., MacCallum, M., Hoenselaers, C., and Herlt, E. (2003), Exact Solutions of Einstein’s Field Equations, 2nd edn (Cambridge UniversityPress). Stergioulas, N. (2003) ‘Rotating Stars in Relativity’, Living Rev. Relativity 6, 3. URL: http://www.livingreviews. org/lrr-2003-3 Synge, J. L. (1960) Relativity: The General Theory (North-Holland, Amsterdam). Synge, J. L. (1965) Relativity: The Special Theory (North-Holland, Amsterdam). Tayler, R. J. (1994) The Stars: their Structure and Evolution, 2nd edn (Cambridge University Press, Cambridge). Taylor, E. F. & Wheeler, J. A. (1966) Spacetime Physics (Freeman, San Francisco). Taylor, J. H. & Weisberg, J. M. (1982) Astrophys. J., 253, 908. Terletskii, Y. P. (1968) Paradoxes in the Theory of Relativity (Plenum, New York). Teukolsky, S. A. (1972) Phys. Rev. Lett., 29, 114. Thiemann, T. (2007) Modern Canonical Quantum General Relativity (Cambridge University Press, Cambridge). Thorne, K. S., Caves, C. M., Sandberg, V. D., & Zimmerman, M. (1979) ‘The quantum limit for gravitational-wave detectors and methods of circumventing it’. In Smarr (1979a), p. 49. Tipler, F. J., Clarke, C. J. S., & Ellis, G. F. R. (1980), ‘Singularities and horizons –a review article’. In Held (1980b), p. 97. Wald, R. M. (1984) General Relativity (Chicago University Press, Chicago). Wald, R. M. (1994) Quantum Field Theory in Curved Spacetime and Black Hole Thermodynamics (Chicago University Press, Chicago). Wambsganss, J. (1998) ‘Gravitational lensing in astronomy’, Living Rev. Relativity, 1, 12. URL: http://www. livingreviews.org/lrr-1998-12 Ward, W. R. (1970) Astrophys. J., 162, 345. Weber, J. (1961) General Relativity and Gravitational Waves (Interscience, New York). Weinberg, S. (1972) Gravitation and Cosmology (Wiley, New York). Weisberg, J. M. & Taylor, J. H. (2005), in F. A. Rasio and I. H. Stairs (eds.), Binary Radio Pulsars (Astr. Soc. Pacific, San Francisco), pp. 25–32. Whiting, B. F. (1989) J. Math. Phys., 30, 1301–1305. Wiedemann, H. (2007) Particle Accelerator Physics, 3rd edn (Springer, Berlin). Will, C. M. (1974) Astrophys. J., 191, 521. Will, C. M. (1975) Astrophys. J., 196, 41. Will,C.M.(1993)TheoryandExperimentinGravitationalPhysics(Cambridge University Press, 2nd edn.). Will, C. M. (2006) ‘The confrontation between general relativity and experiment’, Living Rev. Relativity, 9, 3. URL: http://www.livingreviews.org/lrr-2006-3 Williams, L. P. (1968) Relativity Theory: Its Origins and Impact on Modern Thought (Wiley, New York). Wilson, R. W. (1979) Rev. Mod. Phys., 51, 433. Woodhouse, N. M. J. (2003) Special Relativity (Springer, London). Woodhouse, N. M. J. (2007) General Relativity (Springer, London). Woosley, S. E. & Bloom, J. S. (2006) ‘The Supernova Gamma-Ray Burst Connection’, Ann. Rev. Astron. Astroph., 44 507–556. Yano, K. (1955) The Theory of Lie Derivatives and its Applications (North-Holland, Amsterdam). Yao, W.-M. et al. (2006) J. Phys. G., 33, 1. This is kept up to date on the Particle Data website, http://pdg.lbl. gov/2006/reviews/contents_sports.html Zel’dovich, Ya. B. & Novikov, I. D. (1971) In Thorne, K. S & Arnett, W. D. (eds.), Stars and Relativity (Relativistic Astrophysics Vol. I) (University of Chicago Press).