||
白矮星弯曲了周围的时空,从而弯曲了背景恒星发来的星光。通过测量星光的偏折程度,可以得到白矮星的质量。实线为恒星的真实位置,虚线为观测位置。(图片来源:NASA,ESA and A.Field)
真正的胜利,并不是你用武器争取的,那一定要用你的信心。无论多可怕的武器,也比不上人的信心。
——古龙《七种武器·孔雀翎》
最近,天文学家观测到了“微引力透镜效应”:一颗遥远恒星(“背景恒星”)发出的星光,在经过某颗白矮星附近时被偏折了,看起来好像改变了它在太空中的位置。(详情请见研究论文[1]和新闻报道[2])
这是一个非常有趣的工作。我说它有趣,不是因为“天文学家证明了爱因斯坦是错的(但也是对的)”,而是因为它牵涉到物理学的很多方面,从简单的经典力学和几何光学,到深奥的量子力学和广义相对论,从微小的原子核,到宽广的银河系,从如何在随机的恒星分布里选择观测样本,到怎样从微弱的光谱信号中提取信息。
物理学研究的对象和手段,没有限制。
什么是引力透镜?
苹果从树上掉下来,是因为重力(也就是地球引力)。朝天上射出去的子弹,最终还会落到地面上,也是因为重力。只有牛顿第一个认识到了,月亮绕着地球传,竟然也是重力作用的结果。
无论子弹还是月亮,它们的运动轨迹都会在引力场中偏转,这个引力场可以来自于地球,也可以是太阳,可以是任何东西——这就是牛顿的万有引力定律。
物体运动的速度越快,它在引力场的偏转就越小。运动速度最快的是谁呢?当然是光了。光是直线传播的,它在引力场中也会偏转吗?是的,爱因斯坦如是说。其实,牛顿也是这么说的。牛顿和爱因斯坦的差别,从结果上来看,仅仅是差了个系数2,但是,这个差别意味着世界观的差别。更多的细节就不说了,附录里有些要点。
爱因斯坦创立了广义相对论,认为光在引力场中会偏折,偏转角$\theta \sim 4 GM/\rho c^2$。其中,$G$是万有引力常数,$M$是引力中心的质量为,$c$是光速,$\rho$是光线与引力中心的最近距离。以太阳为例,擦着太阳边缘入射到地球上的光线,其偏转角度是1.75”(大约是8个微弧度),很小的一个值。因为光线偏折了,我们就会以为发光体的位置改变了。
这时候,引力场的作用就相当于一个透镜,也有汇聚光和成像的作用。与光学里的常见透镜不同的是,对光线的偏折角度,引力透镜是越近越大,而光学透镜则是越远越大(在薄透镜和傍轴近似下)。所以,引力透镜并不会把所有的平行入射光线都汇聚到一个焦点上,而是与光轴平行的不同光环,汇聚到光轴上的不同位置。
探测系统:哈勃望远镜的指标
哈勃望远镜是个抛面镜,口径是2.4米,焦距57.6 m,分辨率是0.05角秒(大约$ 2\times10^{-7}$弧度)。卫星距离地面大约500公里,转动周期约95.5分钟。观测范围是紫外、可见和近红外光谱区。CCD探测器大致是2000x2000个像素,每个像素的尺寸约15um(哈勃有多个探测器,用于不同的光谱区,指标也不完全相同)。
衍射极限决定于波长$\lambda$和镜子口径$D$,大致是$\lambda/D = 500nm/2.4m \sim 2.1 \times10^{-7} $,这就是0.05角秒的来历了。
从像素的角度来看,也是如此,分辨率决定于像素的大小$d$和焦距的长短$L$。$d/L=15um/57.6m\sim 2.6\times 10^{-7}$,与衍射极限是一致的。这当然不是巧合,它就是这样设计的,否则必然是浪费。
卫星绕地球运动的周期就更简单了。$T=2\pi R/v =2\pi R /\sqrt{GM/R} = 2\pi\sqrt{R^3/GM}$,其中,$R=6900 km$是卫星轨道半径(6400+500),$G=6.67\times10^{-11} N\cdot m^2 /kg^2$是万有引力常数,$M=5.98\times 10^24 Kg$是地球质量。代入数值得到,$T=5.7\times10^3$,就是95.4分钟了。
由此可知,哈勃望远镜的视野大约是100角秒(1’40”),而哈勃望远镜每秒钟转动的角度大约是230角秒(3’50”)。
成像物体:背景恒星(也就是光源)
银河系的直径约为10万光年,中心厚度约为1.2万光年,包括1000亿到4000亿颗恒星。由此可知,典型的恒星间的距离大约是几光年。距离太阳最近的恒星是半人马星座的比邻星,大约4光年(一年约3000万秒)。太阳的直径是大约5光秒。那么它的视直径只有$5/4\times3\times10^7 \sim 4\times 10^{-8}$,已经接近就是哈勃的分辨率了,更远的恒星就更别说了,所以,所有的光源都可以当作点光源处理。
地球绕太阳公转的半径大约是500光秒。由于,地球的公转,比邻星的视差大约是其视直径的200倍,也就是$10^-5$,大约2角秒。此外,恒星自己的运动也为视差做了些贡献,大致也是这个数量级。成像恒星是一颗矮星(K dwarf),距离我们大约是6000光年(2 kpc),视差当然就更小了,大约是毫角秒的量级,但是,仍然与偏转角度相仿,所以也是必须考虑的。
为了定位,还要用到其他一些恒星,它们与微引力透镜的角距离比较大,不会发生光线偏折。这些定位恒星与地球的距离也是几千光年。
微引力透镜:白矮星Stein 2051B
这次观察到的白矮星Stein 2051B到地球的距离大约是18光年,其每年的视差(主要来自于它相对于太阳运动的速度)是2.374”,而因为地球公转引起的视差大约是0.5”。
选择它的原因是:1、离得近,所以视差大,与背景恒星的角距离的变化也就大一些;2、个头小,亮度低,这样对背景恒星成像的干扰就小一些;3、质量大,它是个白矮星,与太阳质量相仿,所以偏折角度也就大一些(大约是1个毫角秒);4、它的质量和大小能够用来验证白矮星的形成机制(以前的数据与理论符合得不够好)。
白矮星的形成机制,简单说两句。太阳的内部有热核反应,由此产生的高温就足以抵抗引力了;白矮星产生的能量不够多(它是太阳的晚期),需要电子简并压力(这是量子统计特性导致的结果)来抵抗引力;中子星里,电子简并压力也不够了,电子与质子复合形成了中子,然后靠中子的简并压力来抵抗引力;等到这个也不行了的时候,就是黑洞了,也许之前还有个“夸克星”的阶段。(注意,我们并不是说,一个恒星会在一生中经过所有这些阶段。这实际上是恒星整体的结局,至于某个特定恒星的最终结局,到底是白矮星、中子星还是黑洞,主要的决定因素是星体的质量。)
微引力透镜的测量困难
微引力透镜的概念很简单,公式用起来也很方便(你并不需要自己去推导它,只要拿来用就是了),但是测量起来很困难。
为什么呢?主要是因为天上的星星太少了。
估计一下吧。假定背景恒星、微引力透镜星体和哈勃望远镜位于同一条直线上(此时的偏折角度最大,实际上我们假设的是,这三者夹角与光线偏折角度相仿),再假设作为微引力透镜的星体跟太阳差不多,到我们的距离是$L$,背景恒星(足够远)发出的光线与它的最近距离就是$d=L\theta$,那么,偏转角大约是$\theta = GM/(L\theta c^2)=(GM/ R_{sun}c^2)(R_{sun}/L)/\theta$,由此得到,$\theta=3\times10^{-3}\sqrt{R_{sun}/L}$。即使我们选择$L$为10倍于比邻星的距离,$\theta$也只有$2\times 10^{-7}$(大约是0.3个角秒),这就意味着需要 $4\pi/\theta ^2 \sim 3\times 10^{14}$颗恒星,远远超过了银河系里的恒星数目($\sim 10^{11}-10^{12}$)。其他星系离我们太远,单个恒星不足以成像(没有那么多的光)。
那么就只有放松要求了,让偏转角小一些,背景恒星、微透镜星体和哈勃的夹角就可以大一些了。还是考虑银河系,$10^{11}$个星体,角距离大约是$\sqrt{4\pi/10^{11}}\sim 10^{-5}$(大约是2个角秒),预期的光线偏转角就是$4\times 10^{-9}$弧度,大约是1个毫角秒,这是非常小的角度,但是还是哈勃能测量。
需要注意的是,背景恒星、微透镜星体和哈勃望远镜这三者共线的时候,看到的星像是一个光环,而三者非共线的时候,就只能看到两个像了,它们都位于这三者构成的平面内:一个像是走近路、略微弯折一些而已;另一个像是走远路、绕过微透镜星体而来。前者要比后者亮得多,通常看不到后者(因为偏折角远小于哈勃的分辨率)。
这些估计都很粗糙,但是数量级是对的。很容易做些更详细的估算,但是很烦人。这篇文章的工作也不是这样做的,他们用的是查表法:近年来的巡天数据已经给出了很好的星体分布及运动的信息,根据自己的需要挑选就可以了。
如何实现1毫角秒的测量精度?
前面介绍过了,哈勃望远镜的分辨率是0.05个角秒,也就是50毫角秒,这是由衍射极限决定的,也是由CCD每个像素的大小决定的。然而,微引力透镜对光线的偏折角度只有1个毫角秒,那么问题来了:怎么样用50毫角秒的分辨率实现1毫角秒的测量精度?答案是,收集尽可能多的星光。一个光子的平均位置方差是50毫角秒,为了达到1毫角秒,需要的光子数至少是50的平方,大约是10000个光子(这里是数量级估计,而且是理论极限)。
换一个提问的方式。我们在多远的距离上,哈勃望远镜可以收集到来自于太阳的10000个光子?镜子的面积大约5平米,地球附近的太阳光功率是每平米2kW,CCD曝光时间大约是毫秒量级(这是我猜的,例如文献[1]里的table1里说,Epoch1,1 Oct. 2013, Exp.time(s) 0.5/250),那么就可以收集$10^{20}$个光子。如果只能收集到1万个光子,那么距离就应该是日地距离的$10^8$倍数,大约是两千光年的样子。这篇文章里的背景恒星的距离是6000光年,数量级是对的。这个值好像有些偏小:也许是因为我对曝光时间的理解不太对头;也许只是因为这颗背景恒星比太阳更亮一些,但是考虑到还有好几颗用于定位的背景恒星,应该不是这个原因。
最后的话
这个工作很有趣,而且可以用大学物理知识理解大部分的内容。更重要的是,这个工作告诉我们,物理学是我们理解客观世界的方法,它是一个有机的整体,并不是像我们上课是人为区分的那些理论、实验、四大力学什么的。
当然,还可以再继续分析下去,其实,我觉得,完全可以用这个工作把大学的普通物理学讲一遍的。但是我没有更多的信息,也已经用掉了全部的耐心,所以,就到这里吧。
我欲托之空言,不如见诸行事之深切著明也。
参考来源:
[1] K.C. Sahu el al., "Relativistic deflection of background starlight measures the mass of a nearby white dwarf star," Science (2017). http://science.sciencemag.org/content/356/6342/1046
[2] 爱因斯坦曾经认为不可能的事情,天文学家刚刚做到了
http://www.sohu.com/a/148110463_224832
[3] 《宇宙学》 StevenWeinberg 著, 向守平 译, 中国科学技术大学出版社, 2013年
附录:光线在引力场中的偏转
入射物体质量为$m$,引力中心的质量为$M$。入射物体在远处(无穷远处)的速度为$v$,在不考虑引力作用的时候,它与引力中心的最近距离为$\rho$。那么,在引力的作用下,它的偏转角度$\theta$是什么?
牛顿的方法
用量纲法估计一下吧。偏转角度$\theta$是无量纲的量,而与此有关的物理量有两个,入射物体的能量$\frac{1}{2}mv^2$(总能量一定大于零,否则物体就会被引力中心束缚,也就是绕着引力中心转动,或者干脆就掉上去了。),物体在最靠近中心处的势能$GMm/\rho$。所以,偏转角度$\theta$就是后两者的比值$\theta \sim (GMm/\rho)/(\frac{1}{2}mv^2) \sim 2GM/\rho v^2$。
也可以用中学物理方法来估算。入射物体受到比较大的引力的范围是$\sim \rho$,这段时间大约是$\sim \rho/v$,作用力大约是$GMm/\rho^2$,所以,由此获得的动量就是$\sim (GMm/\rho^2)\cdot \rho/v$,对应的速度是$\sim GM/\rho v$(认为它与入射速度垂直),由此产生的偏转角就是$\theta \sim 2(GM/\rho v)/v \sim 2GM/\rho v^2$。引入2是因为入射物体到达最近位置后还会继续前进直到无穷远处。
这两个结果是一样的。这是巧合吗?当然不是,而是因为我碰巧知道这个问题的严格解就是$\theta\sim 2GM/\rho v^2$,也就是说,从经典物理学出发、用微积分的方法求解得到的结果。量纲法和模型估计都只能得到$\theta \sim \alpha GM/\rho v^2$,不可能得到$\alpha$的具体数值。
有意思的是,偏转角度并不依赖于入射物体的质量(只要它远小于引力中心的质量),因为在牛顿力学里,万有引力定律涉及的质量(引力质量)和牛顿第二运动定律涉及的质量(惯性质量)是完全相同的。所以,如果我们不管三七二十一,把光速$c$带进这个公式里,就会看到,光在引力场中会发生偏转,$\theta = 2 GM/\rho c^2$。
爱因斯坦的方法
看过两三篇科普文章的读者都知道:牛顿的时空观是绝对的时空观,三维的绝对空间加上一维的绝对时间;爱因斯坦的时空观是相对的时空观,空间和时间构成了所谓的四维时空。从引力质量与惯性质量等价这个“最幸福的想法”出发,爱因斯坦创建了广义相对论,得到光在引力场中的偏转角是$\theta = 4 GM/\rho c^2$。主要原因是,引力场中的时钟会变慢,而且光具有波动性质。具体证明可以在广义相对论的教科书里找到,我就偷个懒吧。
其实,这里不讲的原因并不仅仅是因为懒,还因为我不懂、也无法用相对论的时空观思考问题。相对论的数学其实并不太难,我能读得懂它的推导、做得来它的习题,困难的地方在于相对论的哲学或者世界观,虽然还远没有量子力学那么怪异,但是我也同样用不起来。
那么,我是怎么理解光在引力场中偏转的问题吗?不加质疑地接受爱因斯坦的方法吗?也不完全是,我采用的是“笨人的方法”,用一种没有太多道理的方式来理解这个问题。
笨人的方法
这是一种怪异的、不太正统的办法,把量子力学和相对论的一些结论硬塞到经典力学里,有些像玻尔发明“旧”量子力学时采用的手段。简单说一下吧。
质能公式$E=mc^2$和光量子公式$E=h\nu$,结合起来可以认为,光子的质量是$m=h\nu/c^2$,这样就可以把光看作是粒子,那么,它在引力场中的偏转就可以套用牛顿公式$\theta = 2 GM/\rho c^2$。。当然,结果并不对,差了个系数2。
粒子在引力场中下落,其动能增加,因为势能转化为动能。套用到光粒子身上,就是$h \nu’= h\nu +GM(h\nu/c^2)/R =h\nu (1+GM/Rc^2)$,这就是引力红移效应。这也对应于引力场里的时钟变慢:同一种原子跃迁发出的光,地面上发出的频率就小于高空发出到达地面时的频率,所以说,地面上的钟慢了。
光的传播更多是一种波动现象,波传播的方向就是等相面的法线方向。考虑一束光在引力场中的传播,由于靠近引力中心的地方时钟慢了(或者说,光的频率变大了、波长变小了),那里累积的光程就多一些,等效于折射率大一些而光波长不变。也就是说,引力场相当于一个折射率渐变的球,越靠近中心,折射率越大。这样一来,光线就要往引力中心偏折了(,阳光在大气层中的折射、以及海市蜃楼也都是这个道理)。把“折射率的变化”等同于引力势的变化,就可以得到偏折角的公式$\theta = 4 GM/\rho c^2$,这是个标准波动光学问题和微积分问题。
都是考虑引力势的变化,从粒子性出发,得到的就是$\theta = 2 GM/\rho c^2$,从波动性出发,得到的就是$\theta = 4 GM/\rho c^2$。系数2和4的差别来自于哪里呢?大致是这样的。从粒子性的角度来看,引力改变了入射体的速度,一部分垂直于入射方向,一部分沿着入射方向,对偏转角有贡献的是前者(因为速度的变化量很小),只有一部分势能起作用了;从波动性的角度出发,关键在于相位的累积,所有的势能都起作用了,所以偏转角就大了。换句话说,粒子的行为只涉及孤立的点,而波的行为还依赖于该点附近的整个邻近地区。
PS: 新出来一篇用人工智能处理引力透镜的文章
Fast automated analysis of strong gravitational lenses with convolutional neural networks
Yashar D. Hezaveh,et. al., Nature 548, 555–557 (31 August 2017) doi:10.1038/nature23463
https://www.nature.com/nature/journal/v548/n7669/full/nature23463.html
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-25 13:44
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社