|
王雄
2019-08
自然界中存在着各种各样的对称性,真实世界的对称性可能是近似满足的,对称性也是艺术家对的美的一种表达方式。面对着自然界形形色色的不同的对称性,这些对称涉及不同的对象,涉及不同类型和不同程度的对称性,对称性的本质就是在一定的变换下保持不变。
数学上的对称性往往更加抽象和本质,数学上描述对称性的工具是群论。18 31 年前后,法国年轻的数学家伽罗华在前人研究的基础上,从人们热知的韦达定理中发现了代数方程根的对称性,构思了“群”的概念,并创造性地从对称性的角度解决了方程式的可解性问题,系统化地阐释了为何五次以上之方程式没有公式解,他系统化地阐释了为何五次以上之方程式没有公式解,而四次以下有公式解。他解决了古代三大作图问题中的两个:“不能任意三等分角”,“倍立方不可能”。这些看似跟对称性没有直接联系的问题,被伽罗华从深层次的对称性角度去分析,从而完美解决。可见研究对称性是抓住问题本质的捷径,可见对称性的力量。在伽罗华工作的启示下,娜威数学家索福斯·李将群与微分方程联系起来,建立了李群理论。李群李代数理论对物理学的几何解释提供了一把钥匙,李群在粒子物理学中的确扮演着十分重要的角色。
对称性在近代物理中的重要性我想怎么强调都不为过。对称性在当代理论物理的两大支柱广义相对论和量子力学中都有着核心重要性。杨振宁先生曾说:“二十世纪物理学的主旋律是量子化、对称性和相因子。”物理学关心的对称性,其实主要是物理规律所具有的对称性,这是很深层次的一种对称性,即要求物理规律在一定的变换下保持不变,这本质上是物理规律统一性的内在要求。物理学的发展方向就是追寻对自然更深刻的理解,更统一的理解,在某种意义下就是更大的对称性。
可以说,现代物理学的每一次重大进展,从狭义相对论、广义相对论、量子力学、量子场论,到规范场理论,都是以变换不变性思想为模线,发展起来的。狄拉克更是指出,理论物理学进一步前进的方向是继续扩大变换不变性。
物理学所谓的物理规律,往往可以通过最小作用量原理来表达,那么研究物理规律的对称性就变成研究作用量本身的对称性。
从作用量原理出发构造粒子体系的场论模型是量子场论中构造动力学模型的基本手续,这是现代物理学中建立理论的一个重要方式。对一个无限多自由度的场论系统,系统的正则坐标是场变量,其中空间坐标$\phi(\vec{x},t)$是用来标识系统不同自由度的指标。
系统的作用量
$$
S=\intd^{4}x\mathcal{L}\left(\phi,\partial_{\mu}\phi\right)
$$
其中,$d^{4}x=dtd^{3}\vec{x}$是Lorentz不变的四维时空体积元;$\mathcal{L}\left(\phi,\partial_{\mu}\phi\right)$是系统的Lagrangian,它是场量及其微商的泛函,并不直接依赖于时空坐标。
因为基于经典力学和经典电磁理论的经验,一般希望得到的运动方程只是时空坐标的二阶偏微分方程,所以假设它只依赖于$\phi$和$\partial_{\mu}\phi$。数学上Lagrangian可以含有高阶微分项(甚至是分数阶项),但是基于经典力学和经典电磁理论的经验,通常不考虑高阶微分项。
这就能推导出Euler-Lagrange方程,即场$\phi$的运动方程
$$
\frac{\partial\mathcal{L}}{\partial\phi}-\partial_{\mu}\frac{\partial\mathcal{L}}{\partial\left(\partial_{\mu}\phi\right)}=0
$$
相对论的场论模型,一般都是从场的Lagrangian出发。一个场论的模型,就是关于场的Lagrangian的一个具体假设。知道了场的Lagrangian,就可以从它的Euler-Lagrange方程得到场的运动方程。在量子场论中,知道Lagrangian,就可以知道相应的Feynman规则,原则上就知道了理论的一切内容。
诺特定理是说,作用量的每一种对称性都对应一个守恒定律,可以相应定义一个守恒流和守恒量。对称和守恒这两个得要概念是紧密地联系在一起的。经典物理范围内的对称性和守恒定律相联系的诺特定理后来经过推广,在量子力学范围内也成立。在量子力学和粒子物理学中,又引入了一些新的内部自由度,认识了一些新的抽象空间的对称性以及与之相应的守恒定律,这就给解决复杂的微观问题带来好处,尤其现在根据量子体系对称性用群论的方法处理问题,更显优越。
在经典力学中,我们所熟悉的这种对应关系是;时间平移对称性(时间平移不变性)对应于能量守恒;空间旋转对称性(空间各向同性)对应于角动量守恒。1、时间平移对称性和能量守恒——时间平移对称性要求物理定律不随时间变化,即昨天、今天和明天的物理定律都应该是相同的。如果物理定律随时间变化,例如重力法则随时间变化,那还想利用重力随时间的可变性,就可以在重力变弱时把水提升到蓄水池中去,所需做的功较少;在重力变强时把蓄水池中的水泄放出来,利用水力发电,释放出较多的能量,这是一架不折不扣的能创造出能量的第一类永动机,这是与能量守恒定律相违背的,这就清楚地说明时间平移对称性与能量守恒之间的联系。
从某种意义上说,如果没有这些对称性,就没有一种合理定义这些基础物理量的方法,关于这些物理量的物理学规律也就无从谈起了。而且我们追求的是一种普适的物理规律,如果此时此地的物理规律不能拿到彼时彼地去应用,那这也失去了理论的指导意义。所以理论物理的本质就需要规律具有尽可能的对称性,即尽可能大的普适性。所以对称性是根植于理论物理研究的基因里的。
Noether 于1918年证明了一个重要定理: 若场的在一个连续变换下保持作用量S不变,则存在一个与之相应的守恒流$j^{\mu}(x)$,它满足连续性方程
\begin{equation}
\partial_{\mu} j^{\mu}(x)=0
\end{equation}
通常把$\mathcal{L}$在某种变换下的不变性,称为它具有某种对称性;所以说,Largrangian的某种对称性对应于某个守恒定律。这是一个普遍的结论,并不局限于与连续变换相联系的对称性。
对守恒流$j^{\mu}(x)$满足的连续性方程在全空间积分,可以给出
\begin{equation}
\int d^{3} \vec{x} \frac{\partial}{\partial t} j^{0}(x)+
\int d^{3} \vec{x} \nabla \cdot \vec{j}(x)=0
\end{equation}
用Gauss定理把第二项换成在无穷远的面积分,当$\vec{j}(x)$在无穷远处为0时,我们有:
\begin{equation}
\frac{d Q}{d t}=-q \int_{\infty} d \vec{\sigma} \cdot \vec{j}(x)=0
\end{equation}
即:
\begin{equation}
Q=q \int d^{3} \vec{x} j^{0}(x)
\end{equation}
其中,q是在Q的定义中适当引入的常熟;所以,存在守恒流$j^{\mu}(x)$就意味着存在全空间的守恒量Q,守恒量密度正比于$ j^{0}(x)$。
以前我们学过在时空连续变换下的不变性,包括平移不变性和洛伦兹不变性。平移不变性反映时空空间的均勾性,是能量,动量守恒定律的基础。洛伦兹不变性是四维时空转动下的不变性,反映四维时空的各向同性。它包括的三维空间转动下的不变性,是角动量守恒的基础。而在量子场论中,场在内部空间也是具有对称性的。场的内部空间是为了描述粒子场的内部性质,如电荷、重子数、轻子数、位旋、味道和颜色等而引入的抽象空间。
现代规范理论正是从外部对称性到更普遍的局域内禀对称性的推广。这第一步是由杨振宁和米尔斯所采用的,当时他们想要寻找假定同位旋守恒定律的后果。同位旋概念是由N. Kemmerz在1938年引入的,同位旋被设想为在进行相互作用时与电子自旋相类似。它在随后的核力理论和规范场理论中都有重要作用。同位旋守恒是核力对电荷无关性这一事实的重新表述。按海森伯的说法,质子和中子是在一个抽象的同位旋空间中的同一个粒子的两个状态。既然电荷守恒与相不变性有关,那么通过类比,人们就会猜想强相互作用在同位旋转动中有不变性。从科学哲学的观点看,在规范不变性的思想中所体现的是,客观的物理事件独立于我们所选择的描述框架,即物理学定律具有某种深刻的内在不变性。同位旋不变性属于规范不变性之列(同位旋空间属于内部空间的一种)。杨与米尔斯所得的结果意义重大。
在规范理论中,内部空间“转动”,用规范群G来表示。规范群的元素写作
\begin{equation}
u(\theta)=\exp \left[-i \theta^{\alpha} T^{\alpha}\right]
\end{equation
其中,$T^{\alpha}$是群G的生成元,满足对易关系
\begin{equation}
\left[T^{\alpha}, T^{\beta}\right]=i f^{\alpha \beta \gamma} T^{\gamma}
\end{equation}
其中$f^{\alpha \beta \gamma}$是群G的结构常熟。$\alpha \beta \gamma=1,2, \dots, N$。N是群G的维数,它等于生成元的个数。$\theta^{\alpha}$是群G的参数,叫做群参数,也有N个。群的生成元可以用作描写场粒子性质的算符。在具体问题中,要选择什么样的规范群,归根到底是要由场粒子的具体性质来确定,要由粒子之间的相互作用规律来确定。
物理系统在内部空间的对称性,用它的拉格朗日密度在以场量的规范变换
\begin{equation}
\Phi^{\prime}(x)=\exp \left[-i \theta^{\alpha} T^{\alpha}\right] \Phi(x)
\end{equation}
和场量的时空导数$\partial_{\mu} \Phi(x)$的规范变换
\begin{equation}
\partial_{\mu} \Phi(x) \rightarrow \partial_{\mu} \Phi^{\prime}(x)=\exp \left[-i \theta^{\alpha} T^{\alpha}\right] \partial_{\mu} \Phi(x)
\end{equation}
下的不变性,即
\begin{equation}
\mathcal{L}\left(\Phi^{\prime}(x), \partial_{\mu} \Phi^{\prime}(x)\right)=\mathscr{L}\left(\Phi(x), \partial_{\mu} \Phi(x)\right)
\end{equation}
来描写。
以上变换就是整体规范变换。在做整体规范变换时,由于$\theta^{\alpha}$是与时空坐标x无关的常数,场量的时空导数$\partial_{\mu} \Phi(x)$就像场量$\Phi(x)$一样变换,这是整体规范变换的一个重要特点。
在内部空间转动下,场量$\Phi_{\sigma}(x)$做变换
$\Phi_{\sigma}(x) \rightarrow \Phi_{\sigma}^{\prime}(x)=
\exp \left[-i \theta^{\alpha} T_{\sigma \rho}^{\alpha}\right] \Phi_{\rho}(x)$
这种变换叫做规范变换。当群参数$\theta^{\alpha}$是与时空坐标x无关的常数时,叫做整体规范变换。当群参数$\theta^{\alpha}$是时空坐标x的函数$\theta^{\alpha}(x)$时,叫做定域规范变换。整体的意思是时空各点的场量都做相同的变换;定域的意思是时空各点作各自不同的变换。
而在定域规范变换下,场量按
\begin{equation}
\Phi(x) \rightarrow \Phi^{\prime}(x)=\exp \left[-i \theta^{\alpha}(x) T^{\alpha}\right] \Phi(x)
\end{equation}
的规律变换。场量的导数$\partial_{\mu} \Phi(x)$的变换
\begin{equation}
\begin{aligned} \partial_{\mu} \Phi(x) \rightarrow \partial_{\mu} \Phi^{\prime}(x) &=\exp \left[-i \theta^{\alpha}(x) T^{\alpha}\right] \partial_{\mu} \Phi(x)-i \partial_{\mu} \theta^{\beta}(x) T^{\beta} \exp \left[-i \theta^{\alpha}(x) T^{\alpha}\right] \Phi(x) \\ & \neq \exp \left[-i \theta^{\alpha} T^{\alpha}\right] \partial_{\mu} \Phi(x) \end{aligned}
\end{equation}
和场量$\Phi(x)$的变换规律不一样。这和整体规范变换不同。可以看到在做定域规范变换时,时空各点的场按各自的量变换,所以当在整体规范变换下不变的拉格朗日密度推广到定域规范变换时,拉格朗日密度不再保持不变。
我们希望不仅仅在整体规范变换下拉格朗日密度不变,而且在定域规范变换下也是不变的。由于$\theta^{\alpha}$与x无关,与x有关只是一个特殊情况,整体规范不变性只是定域规范不变性的一个特例,应该把整体规范变换下不变的拉格朗日密度推广到定域规范不变。如前所述,整体规范不变的拉格朗日密度在定域规范变换下不是不变的,原因在于场量导数$\partial_{\mu} \Phi(x)$和场量$\Phi(x)$在整体规范变换下按同样的规律变换,而在定域规范变换下按不同样的规律变换。由此看来,如果我们把导数$\partial_{\mu} $换成协变导数$D_{\mu}$,把场量导数$\partial_{\mu} \Phi(x)$换成场量协变导数$\partial_{\mu} \Phi(x)$,并要求场量协变导数$\partial_{\mu} \Phi(x)$和场量$\Phi(x)$按同样的规律变换,即:
\begin{equation}
\begin{array}{c}{\Phi(x) \rightarrow \Phi^{\prime}(x)=\exp \left[-i \theta^{\alpha}(x) T^{\alpha}\right] \Phi(x)} \\ {D_{\mu} \Phi(x) \rightarrow D_{\mu}^{\prime} \Phi^{\prime}(x)=\exp \left[-i \theta^{\alpha}(x) T^{\alpha}\right] D_{\mu} \Phi(x)}\end{array}
\end{equation}
那么由它们构成的拉格朗日密度$\mathscr{L}\left(\Phi(x), D_{\mu} \Phi(x)\right)$,就将是定域规范不变的,即:
\begin{equation}
\mathscr{L}\left(\Phi^{\prime}(x),
D_{\mu}^{\prime} \Phi^{\prime}(x)\right)=\mathscr{L}\left(\Phi(x), D_{\mu} \Phi(x)\right)
\end{equation}
接下来是协变导数$D_{\mu}$的选定:
由量子电动力学的启发,按照杨-米尔斯的观点,我们引进规范场势$A_{\mu}^{\alpha}$,定义协变导数为:
\begin{equation}
D_{\mu}(x) \equiv \partial_{\mu}+A_{\mu}(x), A_{\mu}(x) \equiv-i g A_{\mu}^{\alpha}(x) T^{\alpha}
\end{equation}
如此引进的规范场和规范群密切相关。对应于每一个生成元$ T^{\alpha}$,就有一个规范势$A_{\mu}^{\alpha}(x)$。对应于$\alpha=1,2, \ldots, N$个生成元,就有N个规范势。另外,规范场是把导数变成协变导数$D_{\mu}$引进的,而$\partial_{\mu}$和$D_{\mu}$都是四维时空的矢量,$A_{\mu}^{\alpha}$也应该是四维时空的矢量。这就意味着和规范场的相应的规范粒子的自旋一定是1。光子,中间玻色子,胶子等的自旋都是1。g是相互作用常数。
引入规范场$A_{\mu}^{\alpha}(x)$,定义协变导数$D_{\mu}$,旨在使场量的协变导数$\partial_{\mu} \Phi(x)$在定域规范变换下有和场量$\Phi(x)$同样的变换规律,从而把在整体规范变换下不变的拉格朗日密度推广到在定域规范变换下不变的拉格朗日密度。这个目的要求确定了规范势$A_{\mu}^{\alpha}(x)$在规范变换下的变换规律,即:
\begin{equation}
\left(\partial_{\mu}-i g A_{\mu}^{\prime \alpha}(x) T^{\alpha}\right) u(\theta) \Phi(x)=u(\theta)\left(\partial_{\mu}-i g A_{\mu}^{\alpha}(x) T^{\alpha}\right) \Phi(x)
\end{equation}
由此可知
\begin{equation}
A_{\mu}^{\prime \alpha}(x) T^{\alpha}=u(\theta) A_{\mu}^{\alpha}(x) T^{\alpha} u^{-1}(\theta)+\frac{i}{g} u(\theta) \partial_{\mu} u^{-1}(\theta)
\end{equation}
这就是规范势的变换规律。
对称性和相互作用的运动方程,到底哪一个更本质?
在经典力学中,从牛顿方程出发,在一定条件下可以导出力学量的守恒定律,粗看起来,守恒定律似乎是运动方程的结果。但从本质上来看,守恒定律比运动方程更为基本,因为它表述了自然界的一些普遍法则,支配着自然界的所有过程,制约着不同领域的运动方程。
对称性制约作用量的形式,然而物理学家并不可能先验地知道我们这个世界所涉及到的全部对称性,而已经确实知道的对称性又不足以完全确定作用量的形式。尽管作用量可能具有的形式已经大大受到限制,但他们仍然可以具有许许多多种可能的形式,物理学家们不得不采用试探性的方法,根据物理上的可能性依次考察每一个作用量的候选者。
基本物理方程具有某些对称性要求,如Lorentz不变性,广义协变性,局域规范不变性等,这些不变性对方程具有很强的约束作用,甚至完全决定了相互作用。这就是我们所谓的,对称性支配相互作用。我们以电磁相互作用为例,来展现如何完全由对称性原理出发,得到相互作用的具体力学方程,为什么要有电磁场,因为对称性原理需要;为什么电磁场的相互作用规律是这个样子而不是那个样子,因为对称性原理的需要。这是原理决定力学的非常好的案例,体现了原理的力量。
力学系统的问题,归结为拉格朗日密度的具体形式,现在以单个自由电子为例,说明如何构造拉格朗日密度,然后导出运动方程。
设想只有一个自由电子的系统,首先构造自由电子的拉格朗日密度$\mathcal{L}$。自由电子的质量为m,动量为$p_{\mu}$,波函数记为$\psi(x)$。在洛伦兹不变的要求下,可以运用的量是$\bar{\psi }(x)$,$\psi(x)$,$\gamma_{\mu}$,$m$,$p_{\mu}$。由他们构成的相对论不变量为:
\begin{equation}
\mathcal{L}(x)=-\bar{\psi}(x)\left(\gamma_{\mu} \partial_{\mu}+m\right) \psi(x)
\end{equation}
其中$\gamma_{\mu}$是$4 \times 4$的常数矩阵,$p_{\mu}=-i \hbar \partial_{\mu}$。假定这是自由电子的拉格朗日密度,由拉格朗日方程
\begin{equation}
\frac{\partial \mathcal{L}}{\partial \varphi_{a}}-\partial_{\mu}
\frac{\partial \mathcal{L}}{\partial \partial_{\mu} \varphi_{a}}=0
\end{equation}
得
\begin{equation}
\left(\gamma_{\mu} \partial^{\mu}+m\right) \psi(x)=0
\end{equation}
这就是Dirac自由电子相对论运动方程。这个方程对于下列变换不变:
\begin{equation}
\psi(x) \rightarrow \psi^{\prime}(x)=\mathrm{e}^{\mathrm{i} \alpha} \psi(x)
\end{equation}
$\alpha$为一常数,这个变换叫做第一类规范变换,是1929年Weyl提出的,又叫做整体规范变换,$\alpha$是对全时空一样的常数。在这种规范变换下,$\mathcal{L}’=\mathcal{L}$,由于这种不变性,可由Noether定理导出:
\begin{equation}
\partial_{\mu} j^{\mu}=0;\\
j_{\mu}=-\mathrm{i} \alpha \overline{\psi} \gamma_{\mu} \psi
\end{equation}
其中$Q=-i\int j_{\mu}(x)d^{3}x$,取$\alpha=e$,则Q为电荷,$j_{\mu}(x), \mu=1,2,3$为电流强度,$\partial_{\mu} j^{\mu}=0$为电荷-电流守恒,即整体规范不变性导致电荷守恒。
现在将变换$\psi^{\prime}(x)=\mathrm{e}^{\mathrm{i} \alpha} \psi(x)$定域化,即$\alpha$ 不是常数而是按不同x变化。$\alpha \rightarrow \alpha(x)$,定域规范变换$\psi^{\prime}(x)=\mathrm{e}^{\mathrm{i} \alpha(x)} \psi(x)$。
可以验证,这时$\mathcal{L}(x)$对于定域规范变换不是不变了,在定域规范变换下:
\begin{eqnarray}
\mathcal{L}^{\prime}(x)=\bar{\psi}^{\prime}(x)[\gamma_{\mu}(\partial^{\mu}-i\partial^{\mu}\alpha(x))+m]\psi^{\prime}(x)
\end{eqnarray}
如果要求拉氏密度在定域规范变换下不变,就必须在$\mathcal{L}(x)$中多加一项以抵消$\alpha(x)$的贡献,即:
\begin{eqnarray}
\mathcal{L}=-\bar{\psi(x)}[\gamma_{\mu}(\partial^{\mu}-ieA^{\mu}(x))+m]\psi(x)
\end{eqnarray}
这就使得拉格朗日密度对于下列变换不变-定域规范变换:
\begin{eqnarray}
\psi(x) \rightarrow \psi^{\prime}(x)=\mathrm{e}^{\mathrm{i} \alpha} \psi(x) \\
A_{\mu}(x) \rightarrow A^{\prime}_{\mu}(x)=A_{\mu}(x)+\frac{1}{e}\partial_{\mu}\alpha(x)
\end{eqnarray}
使$\mathcal{L}^{\prime}(x)= \mathcal{L}(x)$
所以定域规范不变要求存在有$ A_{\mu}(x)$这种量,这$ A_{\mu}(x)$正是电磁矢量势,又称规范势,规范场。
定域规范不变性给定了电子和电磁场的相互作用,为:
\begin{eqnarray}
-ie(\bar{\psi}(x) \gamma_{\mu}\psi(x))A^{\mu}(x)=j_{\mu}A^{\mu}(x)\\
j_{\mu}=-ie\bar{\psi}(x)\gamma_{\mu}\psi(x)
\end{eqnarray}
这是电子流(电流)与规范势(电磁势)相互作用。
令电磁场张量$F_{\mu\nu}=\partial_{\mu}A_{\nu}-\partial_{\nu}A_{\mu}$
则纯电磁场的拉氏密度为:
\begin{eqnarray}
\mathcal{L}_{A}=-\frac{1}{4}F_{\mu\nu}F^{\mu\nu}
\end{eqnarray}
(电子+电磁场)系统的总的拉氏密度为:
\begin{eqnarray}
\mathcal{L}=-\frac{1}{4}F_{\mu\nu}F^{\mu\nu}-\bar{\psi}\gamma_{\mu}(\partial^{\mu}+m)\psi+ie\bar{\psi}\gamma_{\mu}\psi A^{\mu}
\end{eqnarray}
=电磁场+自由电子+电流与电磁场相互作用。
$\mathcal{L}$对于定域规范变换不变,完全描述了电子电磁场系统。定域规范变换$\psi^{\prime}(x)=\mathrm{e}^{\mathrm{i} \alpha(x)} \psi(x)$,看成是U(1)群的元素,规范变换构成U(1)变换群,称为定域规范群。
从以上例子看到相对论对称原理作为构造拉氏密度的出发点,最小作用量原理是导出系统的动力学方程的出发点,定域规范对称性原理是构造完美的电子电磁相互作用的出发点,它导致规范场的自动自然的出现,成为电子相互作用的媒介,信息使者。
一般来说建立物理理论是自观察数据开始,建立数学模型,再升华到普适的力学。牛顿的万有引力建立即是如此。首先由第谷等记录了详细的观察数据,再由开普勒等人建立了天体运行的唯象模型,以及伽利略等建立了地面上的抛物体的运动模型,最后到牛顿的大统一,把天上和地上的模型都统一到了万有引力的力学方程里。
广义相对论的建立则遵循了自上而下的不同路径。不同于所有其他的物理理论,广义相对论的理论发展是“从对称性出发到方程再到实验”这个连锁方法建立起来的广义相对论,有着惊人的数学美而让人信服,远比其它可能的方案更为简单,而且奇迹般地被无数事实所证实。
自上而下、高屋建瓴的广义相对论领先当时的实验条件太远了。广义相对论所做的各种预言,包括引力波、引力导致的时空膨胀效应,这些观察和数据的积累都是在广义相对论理论发现了数十年上百年后才有的。像广义相对论这种理论,几乎是不可能从数据积累到唯象模型再到理论的。
牛顿力学具有伽利略群的对称性,狭义相对论具有庞加莱群的对称性,广义相对论具有光滑的一一对应的完全变换群的对称性。作为对称性原理的威力,电磁理论和广义相对论理论是两个最好的案例。
在任意的坐标变换$x^{\mu} \rightarrow x^{\prime}^{\mu}(x)$下,度规$ g_{\mu \nu}(x)$依二阶协变张量的方式变换,
\begin{equation}
g_{\mu \nu}(x) \rightarrow g_{\mu \nu}^{\prime}\left(x^{\prime}\right)=
\frac{\partial x^{\rho}}{\partial x^{\prime \mu}} \frac{\partial x^{\sigma}}
{\partial x^{\prime \nu}} g_{\rho \sigma}(x)
\end{equation}
广义相对论可被视为一种规范理论,其规范变换包含广义坐标变换。因此,引力理论的作用量应该是广义坐标变换的不变量。我们可以依能量量纲递增的顺序写出满足条件的各项。量纲为0的项只有一个,即宇宙学项$S_{\Lambda}$,
\begin{equation}
S_{\Lambda}=-M_{\mathrm{p}}^{2} \Lambda \int \mathrm{d}^{4} x \sqrt{-g}
\end{equation}
其中$M_{\mathrm{P}}=(8 \pi G)^{-1 / 2} \simeq 2.4 \times 10^{18} \mathrm{GeV}$是约化的Plack质量,G是Newton引力常数,$\Lambda $即宇宙学常数,而$g \equiv \operatorname{det} g_{\mu \nu}$。量纲为2的项也是唯一的,即著名的Einsein-Hilbert作用量:
\begin{equation}
S_{\mathrm{EH}}=\frac{M_{\mathrm{P}}^{2}}{2} \int \mathrm{d}^{4} x \sqrt{-g} \mathcal{R}
\end{equation}
其中Ricci标量$\mathcal{R}=g^{\mu v} \mathcal{R}_{\mu v}$,Ricci张量$\mathcal{R}_{\mu \nu}=\mathcal{R}_{\mu \lambda \nu}^{\lambda}$,而曲率张量$\mathcal{R}_{\kappa \mu v}^{\lambda}$通过仿射联络$\Gamma_{\mu \nu}^{\lambda}=\frac{1}{2} g^{\lambda \kappa}\left(\partial_{\mu} g_{\kappa \nu}+\partial_{\nu} g_{\kappa \mu}-\partial_{\kappa} g_{\mu \nu}\right)$定义为:
\begin{equation}
\mathcal{R}_{\kappa \mu \nu}^{\lambda}=\partial_{\nu} \Gamma_{\kappa \mu}^{\lambda}-\partial_{\mu} \Gamma_{\kappa \nu}^{\lambda}+\Gamma_{\nu \sigma}^{\lambda} \Gamma_{\kappa \mu}^{\sigma}-\Gamma_{\mu \sigma}^{\lambda} \Gamma_{\kappa v}^{\sigma}
\end{equation}
另一方面,在广义相对论中,物质场与引力场的相互作用遵从最小耦合原则。对于玻色场,这相当于将平直空间中物质场作用量$S_{matter}$中所有的Minkowski度规$\eta_{\mu \nu}$换成一般的度规场$g_{\mu v}(x)$,将时空积分测度$d^{4}x$换成广义坐标变换不变的形式$\mathrm{d}^{4} x \sqrt{-g}$,同时将所有的偏导数$\partial_{\mu}$换成协变导数$\nabla_{\mu}$,此协变导数通过仿射联络$\Gamma_{\mu v}^{\lambda}$而定义,对于一般的张量场$T^{\rho \cdots}_{\sigma \cdots}$,其协变导数为:
\begin{equation}
\nabla_{\mu} T_{\sigma \cdots}^{\rho \cdots}=\partial_{\mu} T_{\sigma \cdots}^{\rho \cdots}+\Gamma_{\mu \lambda}^{\rho} T_{\sigma \cdots}^{\lambda \cdots}-\Gamma_{\mu \sigma}^{\lambda} T_{\lambda \cdots}^{\rho \cdots}+\cdots
\end{equation}
经过这样的替换,物质场即通过能动张量$T_{\mu\nu}$耦合到引力场,这里的能动张量$T_{\mu\nu}$定义为:
\begin{equation}
T_{\mu \nu}=\frac{2}{\sqrt{-g}} \frac{\delta S_{\mathrm{matter}}}{\delta g^{\mu \nu}}
\end{equation}
例如,对于具有作用量$S=\int \mathrm{d}^{4} x \sqrt{-g}\left[\frac{1}{2} g^{\mu \nu}\left(\partial_{\mu} \phi\right)\left(\partial_{v} \phi\right)-V(\phi)\right]$的标量场$\phi$,它的能动张量为:
\begin{equation}
T_{\mu v}[\phi]=\left(\partial_{\mu} \phi\right)\left(\partial_{v} \phi\right)-\frac{1}{2} g_{\mu v}\left(\partial_{\lambda} \phi\right)^{2}+g_{\mu v} V(\phi)
\end{equation}
物质场通过其能动张量耦合到引力场这一事实,可导致等效原理。概言之,在低能、低俗的Newton极限下,度规场的00分量退化为Newton引力势;而能动张量的00分量即为物质场的能量密度,在Newton极限下退化为惯性质量密度。由此可见,物质场所感受到引力作用的强度(即引力质量)正比于其惯性质量,此即等效原理的原始形式。
最后,广义相对论中的场方程可通过将作用量$S_{\mathrm{GR}} \equiv S_{\Lambda}+S_{\mathrm{BH}}+S_{\mathrm{matter}}$对度规$g^{\mu v}$变分而得,即$\delta S_{\mathrm{GR}} / \delta g^{\mu \nu}=0$,其结果为:
\begin{equation}
\mathcal{R}_{\mu \nu}-\frac{1}{2} g_{\mu \nu} \mathcal{R}+\Lambda g_{\mu \nu}=-M_{\mathrm{P}}^{-2} T_{\mu \nu}
\end{equation}
此即带有宇宙学常数的Einstein场方程。
外尔规范理论揭示了一个非常重要的物理思想—“电荷守恒或局域U(1)群的规范对称性决定了全部电磁作用”,以及“只要系统具有U(1)群的规范对称性,就必然要求系统的粒子之间存在电磁作用”和“所有规范作用必须通过规范量子来传递”。外尔的这些观念对杨振宁“有极大的吸引力”,促使他产生了一个大胆而诱人的想法:把外尔从电荷守恒中发现和提出的规范不变性,推广应用到同位旋守恒中去。
1954 年由杨振宁(1922-)和Robert Mills(1927-1999)提出的,现在被称为Yang-Mills理论(Yang-Mills theory)。这是一种所谓的定域“非阿贝尔规范理论”(non-Abelian gauge theory),是对像量子电动力学那样的定域“阿贝尔规范理论”(Abelian gauge theory)的推广。
Yang-Mills理论可以说是外尔的规范电磁理论的推广。但是,根据规范对称性要求,Yang-Mills场和电磁场一样,不能有静止质量。也就是说,Yang-Mills场的三个规范量子和光子一样没有静止质量,这使Yang-Mills场的实际应用受到了很大的影响。在20世纪50年代,Yang-Mills规范理论几乎没有引起太多的注意。
杨振宁到普林斯顿做访问时,曾就他和米尔斯的工作做了一次专题报告。当时,泡利也在普林斯顿访问。报告开始不久,他刚在黑板上写下场方程,泡利就问:“场的质量多大?”杨说:“我们不知道”,然后继续报告。但是,泡利仍不依不饶地再次提出同样的问题,杨回答:“这是一个十分复杂的问题,虽然我们对它进行了研究,但是没有得到明确的结论。”泡利固执地反驳道:“这不是一个充分的辩解。”泡利的问题所指的是:既然电磁场是没有静止质量的,你们的规范场也不应当有质量,而要解释与核有关的短程力,规范场必须有质量。
后来,这个“质量问题”一直困扰着杨振宁。一生追求对称性和理论优美的杨振宁先生,可能没有想到这个问题的解决需要的是一种“对称性自发破缺”的效应,而这是非线性系统常见的效应。
直到20世纪六七十年代,自发对称破缺和希格斯机制的提出导致温伯格、格拉肖和萨拉姆建立弱电统一理论以后,属于它的时代才真正到来——荣获1979、1999和2004年三次诺贝尔物理学奖的工作都以Yang-Mills场为其理论基础,使得Yang-Mills规范场理论最终成为强力、弱力和电磁力大统一的理论基础。
世界的统一性要求物理规律具有对称性,那世界的多样性呢?对称性在某种程度上就意味着不可分辨性、一致性和重复。一片雪花我们只需要知道六分之一其余部分都是重复。而我们的世界是如此的丰富多彩,如此的复杂多样。一个本质对称的物理规律真的能描述这个纷繁复杂、五彩斑斓的世界吗?
在这里我将结合非线性动力系统与混沌理论里的若干最新概念,主要探讨这个问题“由对称的物理规律支配的世界何以产生丰富多彩的现象”,我们通过混沌理论里的最新概念“多吸引子共存”来尝试对这一问题进行回答:由于世界是一个复杂的非线性系统,非线性系统里可能产生多吸引子共存、多稳定性效应,这是世界的统一性与多样性的源泉,包括我们会提到的“上帝粒子与质量起源”的问题本质上就是多稳定性的问题。多稳定性可谓是世界统一性与多样性的“玄之又玄,众妙之门”。
物理规律对称性的直接破缺是物理学家不愿意看到的,那将意味着物理规律的不完美。除了对称性的直接破缺,由于运动方程的非线性特性,可能产生一种情况就是物理规律本身仍然保持对称性,但由此对称的规律产生了非对称的现象,这是物理学家可以接受的。
自发对称性破缺(spontaneous symmetry breaking)是指当物理系统所遵守的自然定律具有某种对称性,而物理现象本身并不具有这种对称性,则称此现象为自发对称性破缺。在粒子物理里,通常是指一个物理系统的拉格朗日量(概括整个系统动力状态的函数)具有某种对称性,而真空基态(系统的最低能阶)却不具有该对称性。
实际上,对称性仍然存在于底层的物理规律中,所以其实是对称性被隐藏起来了。
最简单的对称性自发破缺
将一根圆柱形弹性棍直立在桌上,这时火柴棍与重力,桌面构成的体系具有以圆柱形弹性棍为轴的旋转对称性。如果垂直向下压圆柱形弹性棍,那肯定是立不稳的,总会向某个方向弯曲,指向某个特定的方向,破坏先前的旋转对称性。这尽管是一个简单的例子,但呈现了平衡点从稳定变成非稳定,同时产生无数新的平衡态的过程,是混沌学里典型的分叉现象。
顺磁铁磁相变中的对称性自发破缺
铁磁体随着温度的升高,磁性会逐渐下降。直到超过某个特定的温度后,磁性会完全消失。在这个温度以上,只要没有外界磁场,磁体不能自己产生磁场,这时铁磁体已经变成顺磁体。这个转变温度称为居里温度。在居里温度以上,磁体是往往是各向同性的(某些特殊材料除外)。物理体系具有很大的对称性。从宏观上看,这时材料没有磁性,因此也不存在特定的方向。当温度降低时,磁体恢复磁性。如果没有外界磁场诱导,恢复的磁场方向将是随机的,这跟之前处在一个没有特殊方向的状态相关。材料恢复磁场,说明它内部选择了某一个特定的方向作为体系的特定方向。对称性不再保持。这一相变,由具有对称性的状态,自动变到了不具有对称性的状态,就是对称性自发破缺。
晶体对称性
描述固体的定律在整个欧几里德群(Euclidean group)之下具有不变性,但是固体自己将这欧几里德群打破为空间群(space group)。简单想象,液态的水具有更大的对称性,结冰或形成雪花后则丧失了一部分对称性。而各种各样的具体对称性,都是三维空间对称性的子群。
大多数物质的相态可以通过自发对称性破缺的透镜来理解。例如,晶体是由原子以周期性矩阵排列形成,这排列并不是对于所有平移变换都具有不变性,而只是对于一些以晶格矢量为间隔的平移变换具有不变性。磁铁的磁北极与磁南极会指向某特定方向,打破旋转对称性。除了这两个常见例子以外,还有很多种对称性破缺的物质相态,包括液晶的向列相、超流体等等。
类似的希格斯机制应用于凝聚态物质会造成金属的超导体效应。在金属里,电子库柏对的凝聚态自发打破了电磁相互作用的U(1)规范对称性,造成了超导体效应。
大多数物质的相态,例如晶体、磁铁、一般超导体等等,可以从自发对称性破缺的观点来了解。像分数量子霍尔效应(fractional quantum Hall effect)一类的托普相(topological phase)物质是值得注意的例外。
量子力学的真空与一般认知的真空不同。在量子力学里,真空并不是全无一物的空间,虚粒子会持续地随机生成与湮灭于空间的任意位置,这会造成奥妙的量子效应。将这些量子效应纳入考量之后,空间的最低能量态,是在所有能量态之中,能量最低的能量态,不具有额外能量来制造粒子,又称为基态或“真空态”。最低能量态的空间才是量子力学的真空。
设想某种对称群变换,只能将最低能量态变换为自己,称最低能量态对于这种变换具有不变性。假设一个物理系统的拉格朗日量对于某种对称群变换G具有不变性,这并不意味着它的最低能量态对于变换G也具有不变性。假若拉格朗日量与最低能量态都具有同样的不变性,则称这物理系统具有“正合对称性”;假若只有拉格朗日量具有不变性,而最低能量态不具有不变性,则称这物理系统的对称性被自发打破,或者称这物理系统的对称性被隐藏,这现象称为“自发对称性破缺”。
用一个普通例子来解释自发对称性破缺的现象。假设在墨西哥帽(sombrero)的帽顶有一个圆球。这个圆球是处于旋转对称、局部最大引力势能的状态。这状态极不稳定,稍加微扰就可以促使圆球为了降低势能而滚落至帽子谷底。由于圆球滚落的方向具有区别于其它方向的特征,使得对称性被打破。这物理系统的拉格朗日量对于旋转变换具有不变性,但最低能量态不具有不变性,因此产生自发对称性破缺现象。
要具体理解这些直观比喻的意义,最好的方法还是借助于具体数学表达式。
我们考虑一个具有$Z_{2}$对称性的实标量场$\phi^{4}$模型和具有U(1)对称性的复标量场的$\Phi^{4}$模型。
首先,对于具有离散的$Z_{2}$对称性的实标量场$\phi^{4}$模型,其Lagrangian为:
\begin{equation}
\begin{aligned} \mathcal{L} &=\frac{1}{2}\left(\partial_{\mu} \phi\right)^{2}-V(\phi) \\ &=\frac{1}{2}\left(\partial_{\mu} \phi\right)^{2}-\frac{1}{2} m^{2} \phi^{2}-\frac{1}{4 !} \lambda \phi^{4} \end{aligned}
\end{equation}
将$m^{2}$替换为负的参数,$-\mu^{2}$,则有:
\begin{equation}
\begin{aligned} \mathcal{L} &=\frac{1}{2}\left(\partial_{\mu} \phi\right)^{2}-V(\phi) \\ &=\frac{1}{2}\left(\partial_{\mu} \phi\right)^{2}+\frac{1}{2} \mu^{2} \phi^{2}-\frac{1}{4 !} \lambda \phi^{4} \end{aligned}
\end{equation}
其中$\mu$和$\lambda$是势能V的两个参数,$\lambda$项描述场的自耦合。这个模型显然具有$Z_{2}$对称性,即$\mathcal{L}$在变换
\begin{equation}
\phi \rightarrow \phi^{\prime}=-\phi
\end{equation}
下保持不变。
对应的Hamiltonian为:
\begin{equation}
\mathcal{H}=\int d^{3} x\left[\frac{1}{2} \pi^{2}+\frac{1}{2}(\nabla \phi)^{2}-\frac{1}{2} \mu^{2} \phi^{2}+\frac{1}{4 !} \lambda \phi^{4}\right]
\end{equation}
最小能量的经典位形是各项同性的场$\phi(x)=\phi_{0}$,其中\phi_{0}$使得势能
\begin{equation}
V(\phi)=-\frac{1}{2} \mu^{2} \phi^{2}+\frac{1}{4 !} \lambda \phi^{4}
\end{equation}
取最小值。这个势有两个最小值:
\begin{equation}
\phi=\pm v
\end{equation}
其中
\begin{equation}
v=\sqrt{\frac{6 \mu^{2}}{\lambda}}
\end{equation}
常数$v$被称为场$\phi$的真空期望值(VEV)。
假设系统在一个最小值附近,比如说正的最小值附近。然后可以很方便地定义
\begin{equation}
\phi=v+\varphi
\end{equation}
用$\varphi$来表述$\mathcal{L}$。我们发现$\varphi$的线性项不存在。扔掉常数项我们得到Lagrangian:
\begin{equation}
\mathcal{L}=\frac{1}{2}\left(\partial_{\mu} \varphi\right)^{2}-\frac{1}{2}\left(2 \mu^{2}\right) \varphi^{2}-\sqrt{\frac{\lambda \mu^{2}}{6}} \varphi^{3}-\frac{1}{4 !} \lambda \varphi^{4}
\end{equation}
该Lagrangian描述一个简单的具有$\varphi^{3}$和$\varphi^{4}$相互作用的质量为$\sqrt{2} \mu$的标量场。$Z_{2}$对称性$\phi \rightarrow-\phi$不再是明显的了。它唯一的残留体现在上式中三个系数之间的关系上,它们以一个特别的方式仅仅依赖于两个参数。这是一个对称性自发破缺的最简单的例子。
下面我们考虑具有整体的U(1)对称性的复标量场的$\Phi^{4}$模型,其Lagrangian为:
\begin{equation}
\mathcal{L}=\left(\partial_{\mu} \Phi\right)^{\dagger}\left(\partial^{\mu} \Phi\right)-V(\Phi)
\end{equation}
其中
\begin{equation}
V(\Phi)=-\mu^{2} \Phi^{\dagger} \Phi+\frac{\lambda}{2}\left(\Phi^{\dagger} \Phi\right)^{2}
\end{equation}
其中势能V的两个参数$\mu>0$和$\lambda>0$,$\lambda$项描述场的自相互作用强度。$\mathcal{L}$在如下的整体规范变换下保持不变:
\begin{equation}
\Phi \rightarrow \Phi^{\prime}=\exp (i \alpha) \Phi
\end{equation}
其中$\alpha$是实常数。
势能对场求变分,有
\begin{equation}
\frac{\partial V}{\partial \Phi^{\dagger}}=-\mu^{2} \Phi+\lambda \Phi\left(\Phi^{\dagger} \Phi\right)
\end{equation}
不难发现,$\Phi=0$点为极大,说明不是真正的真空,不能在此处展开;极小位于:
\begin{equation}
|\Phi|^{2}=\frac{v^{2}}{2}
\end{equation}
其中
\begin{equation}
v=\sqrt{\frac{2 \mu^{2}}{\lambda}}
\end{equation}
即
\begin{equation}
|\Phi|=\frac{v}{\sqrt{2}}
\end{equation}
该方程有无穷多个解,对应与$\Phi$复平面上半径为$\frac{v}{\sqrt{2}}$的圆周上的点,所以现在真空是无限多重简并的,物理的真空只是其中的一个态。
场$\Phi$的位相变换,相应与场在$\Phi$复平面上的一个转动。在该转动下,简并的真空从一个态变到另一个态。在复标量场的这个模型中,物理真空是取某个特定的相位,从而没有了规范对称性,场$\Phi$的对称性就自发破缺了。上式表明,场在真空态仍然有一定的平均值$\frac{v}{\sqrt{2}}$,而实验测到的只是在该平均值基础上的激发。我们可以把平均值部分分离出来,研究相对于该平均值的激发,
\begin{equation}
\Phi=\frac{1}{\sqrt{2}}[v+\phi+i \rho]
\end{equation}
其中
\begin{equation}
\begin{aligned}|
\langle 0|\phi| 0\rangle| &=0 \\|\langle 0|\rho| 0\rangle| &=0
\end{aligned}
\end{equation}
这两个实标量场是能够直接测量的物理的场,于是我们得到
\begin{equation}
\mathcal{L}=\frac{1}{2}\left(\partial_{\mu} \phi\right)^{2}+\frac{1}{2}\left(\partial_{\mu} \rho\right)^{2}-\frac{1}{2} \lambda v^{2} \phi^{2}-\frac{1}{2} \lambda v \phi\left(\phi^{2}+\rho^{2}\right)-\frac{1}{8} \lambda\left(\phi^{2}+\rho^{2}\right)^{2}
\end{equation}
可以看出,场$\phi$具有正比与真空期望值的质量$\sqrt{\lambda v^{2}}$,该粒子称为Higgs粒子。
另一方面,在分离出平均值$v$以后的场,我们得到无质量的$\rho$场。一个连续对称性的自发破缺,必然会导致无质量粒子粒子的存在;这个普遍的结论就是Goldstone定理。该无质量的场称为Goldstone场,相应的粒子则称为Goldstone粒子。我们注意到,对于离散对称性$Z_{2}$,不存在Goldstone粒子,而对于连续的对称性U(1),存在Goldstone粒子。从物理上看,连续对称性的自发破缺导致基态出现连续的简并,系统在简并态之间的转换不需要能量的交换,所以相应的Goldstone粒子不可能有质量。
在对称性部分我们提到电磁相互作用完全由局域规范对称性原理所决定。在规范场论里,为了满足局域规范不变性,必须设定规范玻色子的质量为零。而另一方面,根据Goldstone定理,一个连续对称性的自发破缺,必然会导致无质量粒子的存在。这里有两个零质量的问题,没想到他们居然神奇的互为解药,这就是希格斯机制。
我们分析这二者,Goldstone定理的无质量粒子会出在整体连续对称性上,我们如果让局域对称破缺就可以不受Goldstone定理的束缚; 而 Yang-Mills 理论是一种定域规范对称性,但这里的对称还没有破缺,如果我们让这个局域规范对称自发破缺,那么也许可以拯救Yang-Mills 理论。 如果我们把这两者放在一起,用局域对称来解救Goldstone粒子,用对称破缺来解救Yang-Mills 理论, 让对称性自发破缺干掉那些产生无质量矢量粒子的定域规范对称性, Yang-Mills 理论不就可以摆脱困境了,而且 Yang-Mills 理论中的对称性不是整体而是定域的, Goldstone 定理将不适用于这种对称性的自发破缺, 这样就互为解药两全其美了。
在标准模型里,希格斯机制是一种生成质量的机制,能够使基础粒子获得质量。为什么费米子、W玻色子、Z玻色子具有质量,而光子、胶子的质量为零?希格斯机制可以解释这问题。希格斯机制应用局域规范不变性与自发对称性破缺来赋予粒子质量。在所有可以赋予规范玻色子质量,而同时又遵守规范理论的可能机制中,这是最简单的机制。
根据希格斯机制,希格斯场遍布于宇宙,有些基础粒子因为与希格斯场之间相互作用而获得质量,但同时也会出现副产品希格斯玻色子。由于希格斯场的真空期待值不等于零,因而造成自发对称性破缺,当连续对称性被自发打破后,规范玻色子会获得质量,同时生成带质量的希格斯玻色子与一种零质量玻色子,称为戈德斯通玻色子。通过选择适当的规范,戈德斯通玻色子会被抵销,只存留带质量希格斯玻色子与带质量规范矢量场。
费米子也是因为与希格斯场相互作用而获得质量,但它们获得质量的方式不同于W玻色子、Z玻色子的方式。在规范场论里,为了满足局域规范不变性,必须设定费米子的质量为零。通过汤川耦合(Yukawa coupling),费米子也可以因为自发对称性破缺而获得质量。标准模型中所有基本粒子的质量都来源于电弱统一理论中的规范对称性自发破缺。
1979年瑞典皇家科学院决定将该年度诺贝尔物理学奖授予美国物理学家格拉肖、温伯格和巴基斯坦物理学家萨拉姆,以表彰他们三人在弱电统一理论方面所做的杰出贡献.弱电统一理论是本世纪最伟大的成就之一,它实现了人类认识史上的又一次大综合.实现这种弱作用和电磁作用的统一理论是规范场理论。规范场理论的丰要观点是杨振宁和米尔斯于1954年提出的,但由于规范粒子质量问题而没有得到实质性进展.直到60年代,真空对称性自发破缺的发展才使杨一米尔斯理论获得新生.弱电统一理论正是一方面利用杨一米尔斯理论来描述基本相互作用,另一方面由真空对称性自发破缺来提供规范粒子的质量。可见对称性自发破缺在历史上占有相当重要的地位。
手征对称性破缺指的是强相互作用的手征对称性被自发打破,是一种自发对称性破缺。最简单示范手征对称性的例子就是左手与右手的镜像对称性(mirror symmetry)。在量子色动力学里,假设夸克的质量为零(这是手征极限),则手征对称性成立。但是,夸克的实际质量不为零,尽管如此,跟强子的质量相比较,上夸克与下夸克的质量很小,因此可以视手征对称性为“近似对称性”。由于在量子色动力学的真空里,反夸克-夸克凝聚的真空期待值(vacuum expectation value)不等于零,促使物理系统原本具有的手征对称性被自发打破,这也意味着量子色动力学的真空会混合夸克的两个手征态,促使移动于真空的夸克获得有效质量。
根据戈德斯通定理,当连续对称性被自发打破后必会生成一种零质量玻色子,称为戈德斯通玻色子。手征对称性也是连续对称性,它的戈德斯通玻色子是π介子。假若手征对称性是完全对称性,则π介子的质量为零;但由于手征对称性为近似对称性,π介子具有很小的质量,比一般强子的质量小一个数量级。这理论成为后来电弱对称性破缺的希格斯机制的初型与要素。
根据宇宙学论述,在大爆炸发生10-6秒之后,开始强子时期,由于宇宙的持续冷却,温度下降到低于临界温度KTc≈173MeV,会发生手征性相变(chiralphasetransition),原本具有的手征对称性的物理系统不再具有这性质,手征对称性被自发性打破。这时刻是手征对称性的分水岭,在这时刻之前,夸克无法形成强子束缚态,物理系统的有序参数反夸克-夸克凝聚的真空期望值等于零,物理系统遵守手征对称性;在这时刻之后,夸克能够形成强子束缚态,反夸克-夸克凝聚的真空期望值不等于零,手征对称性被自发性打破。
我们考虑确定性运动的若干可能的终态状态,比如三维自治系统的解在时间趋于无穷的情况,最简单的可能是发散到无穷远,或收敛到平衡点、或周期运动和准周期运动。这几种可能性未免都略显单调,不如我们真实的世界这样丰富多样。事实上,如果方程是非线性的,情况可能不同。
三维自治系统的方程如果是非线性的,除以上可能性之外,还有一种可能性就是不发散局限于有限区域,也不收敛到平衡点,也不周期,轨道永不重复、性态复杂的运动。这种就是混沌。它有时被描述为具有无穷大周期的周期运动或貌似随机的运动等。确定性混沌运动有着自己独有的特征包括,以下我们分别介绍。
传统科普所谓的混沌的蝴蝶效应,即混沌系统对初值敏感性,其实不是发散系统那种初值敏感。发散系统随着轨迹发散到无穷也是有初值的误差导致距离的放大,两个斜率差一点点的直线也会在直线无限延伸后越来越远,这种“失之毫厘谬以千里”其实不是混沌的本质。混沌是有界的,意味着有那么一个包含混沌吸引子的区域,它的运动轨线一旦落入这个区域就会始终局限于一个确定的区域,它的轨线都不会走出混沌吸引子。所以从大范围上来说混沌系统是“稳定”的。
一方面,混沌对初始值是非常敏感的,初始值相差一点点的两个轨迹,随着演化时间的推演,确实会相差越来越远,但轨迹都会无限逼近混沌吸引子。实际上对于经典的只有一个混沌吸引子的系统,不管初始值在什么地方,最终轨迹都在吸引子上盘旋,所以这在某种程度是一种初值“不敏感”,因为不管取什么初始值最终的状态都很接近。换句话说,系统的演化已经忘掉了初始值。这两种效应构成了初值敏感和初值脱敏的辩证统一。所以混沌的“失之毫厘谬以千里”,是一种更加微妙的对初值的敏感。
爱因斯坦说过一段有意思的话:“量子力学的确让人印象深刻。但是我的内心却有一个声音告诉我,它还不是正确的理论。这个理论是说了很多,但它并没有引领我们更接近上帝的秘密。我无论如何,深信上帝不掷骰子。”爱因斯坦这里讨论的是描述世界运作的本质物理规律是否会有随机性,我想爱因斯坦自己也不会反对可以用随机来描述一些现象,但这里指的是根本自然规律是否随机的问题。
物理规律是否可以是本质随机的?除了现在所谓量子力学里波函数坍塌的随机性,物理规律里有本质随机的吗?筛子的机械运动是完全确定性的。电脑能产生真的随机吗?什么是真的随机?所谓电脑上一切的随机模拟,其实都是伪随机。其实理论上所有的系统都是确定的,随机只是表象,是一种权宜的处理问题的方法。比如掷筛子,如果精确地知道一切初值条件,那么筛子的一切运动细节都可以精确地确定下来。但由于这种信息的实际不可获取,而我们也不关心全部的运动细节,只关心最终的落地稳定后的朝向。那么完全可以用更简单的方法来对待,即朝向是随机的,各1/6可能,所以我们可以用随机的模型来表观地描述这种随机的现象,但深层次的物理规律是完全确定的。要产生“真正”的随机,就要创造这种高度复杂的物理系统。
本质确定的方程可否描述表象随机的现象?混沌学给了我们肯定的答案,完全确定的微分方程,但其运动状态却具有某些“随机”表现,那么产生这些随机性的根源只能在系统自身,即混沌系统内部非线性自发产生的这种随机性。
所以,我认为结论是非常辩证的:真正的随机来源于完全的确定性系统。若不相信物理规律本质的完全确定性,我们也不能相信我们使用的随机方法来表观地描述随机现象。没有确定性,就没有随机。
如前所述,混沌的本质不在于所谓对初值的敏感性,实际上混沌与稳定的区别,本质上是吸引子结构的差别,是从整数维到分数维的吸引子这样一个飞跃。
所谓稳定解,就是零维的点吸引子;所谓周期解,一般指稳定的周期解,实际上就是一维的线吸引子。对于高维相空间,三维以上的空间,还可以产生二维的吸引子,即吸引子构成一个环面,在环面上就可以产生拟周期解。
对于3维相空间,其吸引子肯定是要小于3维的,那么除了0维点吸引子,1维线吸引子,2维环面吸引子以外,似乎是没有别的可能性了。混沌的神奇在于,其吸引子可能是分形的,即分数维的,从2到3之间,产生了无限的可能性。
整数维的几何是简单的,相对于传统几何学的研究对象为整数维数,如,零维的点、一维的线、二维的面、三维的立体,分数维的几何则复杂得多。分维性表示混沌运动状态具有多叶、多层结构,且叶层越分越细,表现为无限层次的自相似结构。普遍存在于自然界中,因此分形几何学又被称为“大自然的几何学”。
什么是维数?维数的本质跟测量密不可分。下面我们举例说明一下分维的概念。一个正方形,将它的边长扩大3倍后,和原来相似,而且相当于9个小正方形。同样的,一个正方体的一边长扩大3倍后,和原来相似,而且相当于27个小正方体。这里面就蕴含了维度的定义。在二十世纪七十年代,法国数学家曼德尔勃罗特在他的著作中探讨了英国的海岸线有多长?这个问题依赖于测量时所使用的尺度。如果用公里作测量单位,从几米到几十米的一些曲折会被忽略;改用米来做单位,测得的总长度会增加,但是一些厘米量级以下的就不能反映出来。像海岸线这种有无限精细结构又自相似的几何对象,需要用分数维来刻画。
总之就好像2和3只是两个简单的整数,2与3之间却充满了无穷无尽的各种实数。混沌吸引子也是,混沌吸引子突破了2维,在2维到3维之间的广阔空间里,有无限丰富的可能性。
混沌,本质上是吸引子结构从整数维到分数维的吸引子这样一个飞跃。
平衡态与混沌是对立的吗?一个系统是否可能既是平衡的,又是混沌的?现实世界充满了各种平衡态和混沌,是否可以统一描述?
在统计力学里,远离平衡态也是非常重要的概念。平衡态固然重要,但我们所见的世界并不是单调的、热寂的,而是充满生机的,不断进化,生机勃勃丰富多彩的。
混沌学里的新发现告诉我们,平衡和混沌不是对立的,往往是可以共存的。如果我们限定讨论三维连续自治系统,混沌吸引子一般被认为出现在具有至少一个不稳定鞍焦型平衡点的系统之中。而经典熟知的所有混沌系统也确实都满足这个条件。熟知的经典三维连续自治混沌系统(包括经典的Lorenz系统、Chen系统、Lü系统、Rössler系统、Sprott系统等)都可以利用Shilnikov方法来研究系统的混沌存在性和诠释混沌产生的机理。它的核心思想是基于系统的不稳定鞍焦平衡点,利用符合条件的一条同宿轨道或异宿轨道,由它的自相交推出吸引子的存在。根据以上经典研究,混沌吸引子一般被认为出现在具有至少一个不稳定鞍焦平衡点的系统之中。而经典熟知的所有混沌系统也确实都满足这个条件。但是Shilnikov定理虽然说明了存在鞍焦型平衡点的系统在某种特定条件下会产生混沌,但这个是混沌产生的充分而并非必要条件。另一方面,Hartman-Grobman定理严格说明如果非线性系统双曲型平衡点稳定,其平衡点附近的动力学行为也是渐进稳定的,但是此定理对远离平衡点处的动力学行为不作任何规定。因此,也并不排除无平衡点或者仅有稳定平衡点的三维连续自治系统在远离平衡点处产生混沌的可能性。基于上述思考,申请人和陈关荣教授得到了有且仅有一个稳定平衡点的混沌系统,系统数学模型如方程(1)所描述。上述成果也被国际混沌学者们所注意,J.C. Sprott参与合作深入研究了该系统的有趣的动力学行为,发现除了稳定的平衡点,混沌的吸引子之外,该系统还有一个吸引域很小的周期轨道。这样一个简单的系统里同时有三类不同类型的吸引子共存。这些不同的吸引子各自有其复杂的吸引域,整个相空间被若干个吸引子所割据,其各自的吸引域互相交织,盘根错节,甚至可能有非常复杂的分形边界,而且这些吸引域会随系统参数变化而变化。
图. 仅有一个稳定平衡点的混沌系统a=0.01,左图为三种吸引子共存的示意图,绿色为稳定平衡点,红色为稳定周期轨道,蓝色为混沌吸引子;右图为三种不同吸引子的各自吸引域,截取过平衡点的X-Z初始值平面,绿色区域落入稳定平衡点,红色区域为周期轨道吸引域,蓝色区域为混沌吸引子的吸引域。
这些新发现表明,混沌动力学行为不依赖于局部平衡点的个数与稳定性,可以说混沌是非线性系统的一种全局动力学行为。这种全局混沌动力学行为也被有些学者称为具有“隐藏吸引子”。传统混沌吸引子被视为不稳定的平衡点存在同宿轨/异宿轨而自激发产生(self-exited attractor)。而如果平衡点稳定或者没有平衡点的混沌系统,其混沌吸引子的吸引域是不包含任何平衡点,故从平衡点附近的初始值出发就可能不被吸引到混沌吸引子,或者此类混沌吸引子的吸引域非常小,从而如果从平衡点附近出发在数值模拟中有可能找不到混沌吸引子,所以国际上有些学者称此类混沌吸引子为“隐藏吸引子”,以区别传统的平衡点自激发产生混沌吸引子。隐藏吸引子本质上是非线性系统大范围的不依赖于平衡点局部的非线性复杂动力学特性,此类新型具有隐藏吸引子的混沌系统研究成为最新涌现的混沌前沿研究的热点。
简单的系统里同时有三类不同类型的吸引子共存。这些不同的吸引子各自有其复杂的吸引域,整个相空间被若干个吸引子所割据,其各自的吸引域互相交错,盘根错节,甚至可能有非常复杂的分形边界,而且这些吸引域会随系统参数变化而变化。多种吸引子共存是具有隐藏吸引子的新型混沌系统特有的新奇动力学行为。
是什么让我们的世界如此生机勃勃,万类霜天竞自由?我相信,生命等等复杂的结构就产生于远离平衡态的混沌状态,因此具有无穷无尽的可能性。
本书的题目所谓的多稳定性Multistability,传统上讲是一个动力系统有多个稳定的平衡点。但我们其实主要指的是多吸引子共存,甚至可以是各种不同类型的吸引子的共存。
经典的混沌系统通常只有一个混沌吸引子,具有全局吸引性,所以方程的对称性决定了混沌吸引子的对称性,通常的研究主要集中在平衡点的稳定性分析、系统的功率谱图、Poincare截面图、分岔图和Lyapunov指数谱等,往往忽略初始值对系统最终状态的影响。新型混沌系统与经典的混沌系统不同,往往存在多个不同的吸引子,甚至是多个不同类型的吸引子共存,所以不同的初始值可能会导向不同的吸引子。
这时候如果方程是对称的,方程的解,以及方程解的最终状态或可观察状态都可以不是对称的,这就是对称性自发破缺的新奇动力学行为,对于经典系统比较罕见,而对于新型混沌系统比较普遍和常见。
对于动力学方程满足对称性,一些系统演化得到的吸引子也保持这种对称,经典的Lorenz系统和Chen系统都满足z-旋转对称性。如Lorenz系统:
\begin{equation}
\left\{
\begin{array}{l}
\dot{x}=\sigma \left( y-x\right) \\
\dot{y}=rx-y-xz \\
\dot{z}=-bz+xy\,,
\end{array}
\right.\label{ch17:1}
\end{equation}
which is chaotic when $\sigma =10,\ r=28,\ b=\frac{8}{3}.$
Chen系统:
\begin{equation}
\left\{
\begin{array}{l}
\dot{x}=a(y-x)\\
\dot{y}=(c-a)x-xz+cy \\
\dot{z}=-bz+xy\,,
\end{array}
\right.\label{ch17:2}
\end{equation}
which is chaotic when $a=35,\ b=3,\ c=28$.
这些系统的方程满足$z$-轴对称性,也就是说 $(x,y,z)$ 变换到 $(-x,-y,z)$的时候,方程形式保持不变。而这些相关的系统,都产生一个有同样对称性的吸引子。
一般地,满足 $z$-轴对称性的方程满足以下通式:
\begin{equation}
\left\{
\begin{array}{l}
\dot{x}=a_{11}x+a_{12}y\\
\dot{y}=a_{21}x+a_{22}y+m_1xz+m_2yz \\
\dot{z}=a_{33}z+m_3xy+m_4x^2+m_5y^2+m_6z^2+c\,,
\end{array}
\right.\label{ch17:3}
\end{equation}
基于这个通式,我们发现了如下系统\cite{wang12}
\begin{equation}
\left\{
\begin{array}{l}
\dot{x}=-x+y \\
\dot{y}=-x-0.1y-yz \\
\dot{z}=-0.5z+x^2-k\,,
\end{array}
\right.
\end{equation}
where $k$ is a real parameter.
这个系统非常有趣的是,当$k$变化的过程中,系统从一个对冲的吸引子,会自发破缺到两个吸引子,而这两个吸引子都丧失了原来系统方程的对称性。
如何从方程本身来判断吸引子是否会保持对称性,对称性自发破缺发生的临界状态有什么特殊之处,如何预测,这是混沌理论面临的新的大问题。
多稳定性的前提是背后有统一的运动学方程统治全部的状态空间,所以多稳定性强调的不是不同的规律造成的多样性,而恰恰强调的是同一套物理规律下能产生不同的观察现象。物理学家的梦想则是建立最终的描述世界的终极统一的方程,不管是极大尺度的宏观宇宙,还是极小尺度的基本粒子,不管是日常生活的平常世界,还是极端条件的天体如黑洞等。我们的梦想是,同一个宇宙,同一个方程。
所谓对称性自发破缺 (spontaneous symmetry breaking), 用量子场论的语言来说就是一个物理体系的 Lagrangian 具有某种对称性, 而基态却不具有该对称性。 换句话说, 体系的基态破缺了运动方程所具有的对称性。 在量子场论中, 体系的基态是真空态, 因此对称性自发破缺表现为体系 Lagrangian 所具有的对称性被真空态所破缺。
这里面核心的思想就是真空的定义,真空是体系的基态。古往今来,人们一直对真空进行着不懈的探索,走过了迂回、曲折的漫长道路。目前,基于量子场论的“真空是量子场系统的基态”的观念,已成为现代物理为实验证实了的一个深刻的基本观念。量子场论认为:当空间存在某种粒子的时候,表明那里的量子场处于激发态;而不存在粒子时,就表明量子处于基态。这样,在量子场论中真空就被看成没有任何激发的状态,也就是真空是量子场系统的基态。
如果系统能量最低的基态是唯一的,则此真空态便具有和相互作用同样的对称性,这样的真空叫做普通真空或正常真空。如果系统能量最低的基态并不是一个,即实际物理状态的对称性并不反映相互作用的对称性,这种现象叫做真空对称性的自发破缺。对称性破缺的真空是一种新型的真空,它与正常真空相比有很大的不同。这种真空对称性自发破缺理论并非无实际意义的空想。实际上,它在完成弱——电统—理论的过程中起了极重要的作用,而弱电统—理论已为大量实验所证实,当然也是对真空理论的有力支持。真空对称性自发破缺理论不仅对高能物理,还可能在天体物理、固体物理等领域产生深远的影响。
一个物理体系的真空态是由 Lagrangian 所确定的, 为什么会不具有 Lagrangian 所具有的对称性呢? 这其中的奥秘在于许多物理体系具有简并的真空态, 如果我们把所有这些简并的真空态视为一个集合, 它的确与 Lagrangian 具有同样的对称性。 但物理体系的实际真空态只是该集合中的一个态, 这个态往往不具有整个集合所具有的对称性, 这就造成了对称性的破缺——也就是我们所说的对称性自发破缺。
这用非线性动力系统的语言则更加清晰明了,一个动力系统的平衡点或吸引子是由动力学方程所确定的,为什么会不具有动力学方程所具有的对称性呢?这其中的奥秘在于有些动力系统具有共存的多个吸引子。如果我们把所有吸引子视为一个集合,它的确依然具有跟动力学方程同样的对称性,但真实观察到的一个轨迹和吸引子都失去了整体动力学方程的对称性,这可能是对称性自发破缺的更直观的演示。
杨振宁并没有去参与希格斯机制来改造规范场的研究,我想以杨振宁的审美应该也不太满意这样一个解决方案。我个人也不认为希格斯机制是质量起源问题的满意答案。我们对比一下局域规范原理和希格斯机制两种对Lagrangian的改造。局域规范原理对Lagrangian的改造,是从原理出发,非常清晰深刻简明的。原理并不需要真实自然实验观察比如电磁场的经验,而是直接从原理的要求出发,推导出必须存在电磁场。这种自上而下,高屋建瓴的推导,体现了原理的力量。而希格斯机制,则是从实验经验出发,在知道了弱相互作用的规范粒子有质量之后,人为对Lagrangian进行改造,需要额外人为引入一个希格斯的项,而这一项即不是描述物质的粒子,也不是描述相互作用的粒子,而纯粹是为了破缺对称性而产生质量。
那么质量起源到底是什么呢? 希格斯机制这一回答从某种意义上讲与其说是回答了问题, 不如说是在转嫁问题——把我们想要理解的基本粒子的质量转嫁给了 Higgs 场的真空期待值、 规范耦合常数以及 Yukawa 耦合常数。而且这种转嫁,没有原理上变得更简洁明了而是更复杂,而且也并没有实际上的简约化。 比如Yukawa 耦合常数, 它对于每一种费米子都有一个独立的数值。 由于这些参数的存在, 标准模型的 Lagrangian 虽然不显含质量参数, 但它所包含的与质量直接有关的自由参数的数目却一点也不比原先需要解释的质量参数的数目来得少,事实上还略多一点。
因此,我更愿意相信Higgs 机制及包含 Higgs 机制的电弱统一理论是一种唯象的成功描述, 其所体现的把质量与真空的对称性破缺性质联系在一起的思路也极为深刻。 但它们作为与对称性破缺有关的特殊机制或模型, 本身却没能实现对质量概念的真正约化, 从而不能被认为是对质量起源问题令人满意的回答。
这里我个人猜测,需要有一种比局域规范对称性更强大的原理,和对真空的更深层次理解,基于混沌理论里多稳定性的思想,或许能得到一个更满意的答案,那时希格斯机制不用人为额外添加,而是作为更强大的原理的一种更深刻的对称性自发破缺的多稳定性效应。而希格斯机制只是这种新的机制的唯象近似。
统一的物理规律,如何产生丰富多彩的具体现象?一个方程足以描述如此丰富多彩的世界吗?在混沌学革命之后,我们反而对这个问题有了更深刻的信念,因为我们更加知道非线性方程可以产生多么复杂的现象。如果最终所有的物理现象可以用一个方程表述,这就需要这个统一的方程有非常丰富的内涵。
我们总结一下统一的物理规律可能产生丰富多彩的现象的十大原因,同时也对未来可能被发现的最终统一的物理理论的方程进行了天马行空的猜想,作为本文,也作为本书的结尾。
首先,描述物理系统运动状态的变量就非常丰富。物理系统所处的状态首先需要确定外部时空、内部规范对称空间,然后需要描述系统状态的物理量,是张量还是旋量,是几何量还是算符,还是其他更一般的量。
比如狭义相对论里,不同的惯性参考系的观察者们,对两个事件之间的时间间隔和空间间隔都有不同的观察结果,甚至是时间的先后顺序都会有不同的观察结果,但二者将观察到背后统一的时空间隔。所以描述系统的物理量就是协变的向量或张量,而此时的物理量已经有丰富的内涵,对于不同运动状态的观察者会得到非常不一样的观察结果。比如电磁场的运动方程,不同的观察者得到的是看似不一样的物理规律,有的观察者看到的是电的一面,有的观察者看到的是磁的一面。
在将来的统一的方程里,描述物理系统运动状态的变量本身就有足够丰富的内涵,是描述所有不同运动状态下的观察者背后统一的不依赖观察者的客观物理量,这个量应该是张量的某种推广。
这个层面上的,不同观察者的观察现象的多样性,这是同一个物理方程之下可能产生极其不一样的观察现象的第一个来源。
其次,最终的方程里,所有运动状态构成的状态空间结构需要丰富。状态空间本身可能是非平庸的,非线性的,甚至有复杂的拓扑结构。在经典的牛顿力学图像里,质点在三维空间里运动,质点的运动状态包括质点所处的位置和质点的速度,状态空间等同于三维真实空间,加上速度空间。经典牛顿力学里,所有可能的运动状态构成的空间是比较简单的。
但到了电磁场,描述电磁场运动的物理量是电磁矢量势。电磁矢量势本身的分量对不同观察者有不同的投影,这使得不同观察者之间分别看到了统一电磁场的不同侧面。麦克斯韦方程组在电磁学中的地位,如同牛顿运动定律在力学中的地位一样。以麦克斯韦方程组为核心的电磁理论,是经典物理学最引以自豪的成就之一。它所揭示出的电磁相互作用的完美统一,为物理学家树立了这样一种信念:物质的各种相互作用在更高层次上应该是统一的。
电磁矢量势的所有可能状态实际上构成的是一种函数空间,实际上比牛顿力学的状态空间要复杂得多。而广义相对论把引力等效为时空弯曲,时空本身不再只是物理过程发生的容器,而是动力学主体,刻画时空的运动状态的是度规张量场,这个度规场的可能状态更构成了一个复杂的状态空间。这些使得方程可以描述非常复杂多样的现象。
在所有可能的状态构成的空间里,最简单的状态,比如量子场里说的基态,都可能是非平庸的,是丰富多彩的。
经典电磁场理论中场量满足对空间坐标和时间的偏微分方程,因此经典场是以连续性为其特征的。按照量子物理学的原理,微观客体都具有粒子和波、离散和连续的二象性。在初等量子力学中对电子的描述是量子性的,通过引进相应于电子坐标和动量的算符和它们的对易关系实现了单个电子运动的量子化,但是它对电磁场的描述仍然是经典的。这样的理论没有反映电磁场的粒子性,不能容纳光子,更不能描述光子的产生和湮没。因此,初等量子力学虽然很好地说明了原子和分子的结构,却不能直接处理原子中光的自发辐射和吸收这类十分重要的现象。
量子场论给出的物理图像是:在全空间充满着各种不同的场,它们互相渗透并且相互作用着;场的激发态表现为粒子的出现,不同激发态表现为粒子的数目和状态不同,场的相互作用可以引起场激发态的改变,表现为粒子的各种反应过程,在考虑相互作用后,各种粒子的数目一般不守恒,因此量子场论可以描述原子中光的自发辐射和吸收,以及粒子物理学中各种粒子的产生和湮没的过程,这也是量子场论区别于初等量子力学的一个重要特点。量子场论本质上是无穷维自由度系统的量子力学。在量子统计物理和凝聚态物理等物理学分支中,研究的对象是无穷维自由度的系统。在这些分支中,人们感兴趣的自由度往往不是对应于基本粒子的运动而是系统中的集体运动,例如晶体或量子液体中的波动。这种波动可以看作波场,而且它们也服从量子力学的规律,因此量子场论同样可以应用于这些问题。
在量子场论里,粒子就是场的量子激发,每一种粒子都有自己相应的场。粒子之间的相互作用和动力学可以用量子场论来描述。所谓真空,是物理系统所有可能状态里特殊的一些状态,即能量最低的状态,所有的场处于基态时表现为真空。从上述量子场论的物理含义可以知道真空并非没有物质。处于基态的场具有量子力学所特有的零点振动和量子涨落。在改变外界条件时,可以在实验中观察到真空的物理效应。例如在真空中放入金属板时,由于真空零点能的改变而引起的两个不带电的金属板的作用力(卡西米尔效应)以及由于在外电场作用下真空中正负电子分布的改变导致的真空极化现象。
真空的稳定性,需要真空是状态空间里的一种吸引子集。对于不同的势能函数,真空可以是状态空间里的一个点,比如零场,此时真空是状态空间里稳定的平衡点。而非线性动力系统和混沌理论告诉我们,这种子集可能有很复杂的结构,乃至是有非平庸的拓扑结构。如果真空是状态空间里的一些特殊子集,此时的真空则可能有一些非平凡的特性,如对称性自发破缺。
我们猜测,如果真空态本身不是简单的零点,也不是现在希格斯机制里的构成一个特殊对称的子集,而是构成非平庸的拓扑结构的某种“吸引集”,这将带来物理上各种不可思议的效应。
广义相对论的发展在很大程度上取决于引力场方程的解和它们的物理解释。场方程的解是爱因斯坦引力理论的重要内容。场方程是一个以时空为自变量、以度规为因变量的非线性二阶偏微分方程。由于方程本质上的非线性,要获得场方程的严格解十分困难,一般不能严格解出,在不同的情况下我们需要选择不同的近似方法进行求解。常常假定度规具有一些特定的简单形式,如球对称形式、柱对称形式、静态固定并且具有轴对称的形式、平面波形式等。
爱因斯坦场方程的非线性特质使得广义相对论与其他物理学理论迥异。举例来说,电磁学的麦克斯韦方程组跟电场、磁场以及电荷、电流的分布是呈线性关系(亦即两个解的线性叠加仍然是一个解)。另个例子是量子力学中的薛定谔方程,对于概率波函数也是线性的。而爱因斯坦场方程的求解没办法简单线性叠加,而是需要特殊的解的生成技术。解的生成技术,就是寻找一些变换,并通过已知解种子解去生成新解或解族的方法。随着人们的不断尝试,以及解的“生成技术”的蓬勃发展,引力场方程的精确解的个数己经大大增加,然而精确解都是一些特殊的情况,一旦遇到较为具体的现实问题或者要研究一些有意义的问题的时候,人们还要使用近似方法。
有两种这样的方法是特别有用的它们叫做后牛顿近似和线性近似。第一种方法适合于像太阳系这样由引力束缚在一起的缓慢运动质点系统。由引力束缚在一起的质点系统中的粒子作低速运动时,其状态与牛顿的情况偏离不大,所以可以将牛顿的解作为广义相对论的零级近似,所以该方法称为后牛顿近似。这一理论可以用来比较广义相对论和牛顿理论的不同,同时也可用来检验天体力学中的各种引力效应。第二种方法讨论低阶近似下的场,但并不假设物质作非相对论性的运动,因而它适于处理引力辐射的问题。
另外还有微扰法,其实质就是从己知严格解出发,去寻求新的近似解的方法具体地说,首先找一个参考系统,要求一是与所研究系统很相似或很接近,二是能够严格求解。此时,所研究系统的性质与参考系统性质的差异被看作是一种微扰,它可以根据参考系统的特征近似计算。
爱因斯坦认为,最终的统一的方程必须是非线性的,方程的非线性意味着方程解的复杂和多样,并不简单可以有一些解而线性叠加生成。非线性将产生各种不同的解,对应真实世界里的各种多样性。
物理学的发展就是不断把看似不同领域的不同现象的规律统一成了同一个理论的不同现象,而原始在各个不同领域的分散的规律都只是最终统一规律的某一个方面,这些初级的方程都是在具体条件下总方程的某种近似。
以电磁理论为例,麦克斯韦方程组并不是由麦克斯韦本人发现的,而是他在前人总结关于电磁现象基本规律的基础上提出的。奥斯特、安培等人提出了电场产生磁场的理论,而法拉第则提出了磁场产生电场的法拉第电磁感应定律。在这些理论的基础上,麦克斯韦又提出了“位移电流”假说。在此基础上,提出了麦克斯韦方程组,至此电和磁达到了完全的统一,形成了全新的电磁场理论。电荷如何产生电场的高斯定律、论述磁单极子不存在的高斯磁定律、描述电流和时变电场怎样产生磁场的麦克斯韦安培定律、描述时变磁场如何产生电场的法拉第感应定律这些方程都成了最终电磁场方程的一个侧面。
更好的例子是广义相对论,爱因斯坦场方程神奇地包括了牛顿的两大体系,牛顿力学运动方程和牛顿的万有引力方程都作为了爱因斯坦场方程的近似和推论。在狭义相对论里,狭义相对性原理并没有以方程的形式规定具体的力学,还需要对牛顿力学方程进行改造,牛顿万有引力和牛顿力学还是两套独立的东西,到了广义相对论,爱因斯坦为了让广义相对性原理得以自圆其说呈现出来,给出了爱因斯坦引力场方程,神奇的是,这个方程关于引力的描述自然以牛顿万有引力为极限形式,同时方程里已经吸收了牛顿力学方程,即弯曲时空里的牛顿力学方程。爱因斯坦初建广义相对论时,认为广义相对论的基本方程有两个:场方程式和运动方程式。后来,爱因斯坦和福克分别证明,从场方程可以推出运动方程,因此,广义相对论的基本方程只有一个,就是爱因斯坦场方程式,这又是一次伟大的统一和简化。牛顿的两套东西在爱因斯坦这里深刻地统一到一起了,爱因斯坦不愧是牛顿真正的继承者和超越者。
本来以为动力学方程应该附加给广义相对性原理,结果发现不用附加这个额外的“力学方程”,“原理”直接可以导出“力学”,这体现了原理的威力。爱因斯坦张量的绝对导数为零,蕴含了丰富的物质运动的信息:对理想流体,它就是物质场的运动方程;对压强为零的理想流体即尘埃,即可得到尘埃的世界线为测地线;任何自引力足够弱足够小的物体,世界线也为测地线。所以关于自由粒子的世界线为测地线的假设不再是独立的基本假设,牛顿力学已经被吸收了,这是广义相对论的额外的奖励。
其实广义相对论的意义远不止是一个更精细的引力理论,广义相对论是关于时空和物质的深刻革命。爱因斯坦场方程只是广义相对论的某种暂时的具体实现,用爱因斯坦的话说“我一刻也没有怀疑过,(场方程)这种表述方式仅仅是一种权宜之计,以便给予广义相对性原理以一个初步的自圆其说的表示。因为它本质上不过是一种引力场理论,这种引力场是有点人为地从还不知道其结构的总场中分离出来的。”即便是看成一个引力场理论,爱因斯坦场方程比牛顿力学方程也是要高明深刻得多。
在统一理论里,物理系统的运动方程一定也是极大丰富的,而现有的各种力学方程都是统一方程在不同条件下的各种近似或推论。人类认知物理规律的过程中,对各类不同的具体现象做了初步的提炼,得到了各种特定条件下的特定适用范围内的各种方程。这些方程在各自的条件和适用范围内都已经被验证了成立,但这些都只是背后统一理论的各种局部和各个片面,也许他们从唯象层面都有一定的合理性,但从理论自洽和完备的角度都是有问题的,只有深刻揭示了背后统一的方程,才能真正建立对自然自洽和完备的描述,才能窥见真正的大美。
这里的多样性,是统一理论最美妙的地方,可以高屋建瓴俯视所有的局部理论,会当凌绝顶,一览众山小。
在统一理论里,物理系统的拉氏量或运动方程一定是高度非线性的。非线性的方程可能产生丰富的动力学行为,如奇怪吸引子、局域稳定而全局混沌、对称性自发破缺、多吸引子共存等等。非线性的一个典型特性就是初值的敏感性,所以不同于牛顿力学方程的解是比较单调的,牛顿的万有引力方程的解则稍微丰富一点可以是各种二次曲线,而到了广义相对论的爱因斯坦场方程,且不说时空的各种可能解已经极大丰富,其运动学的测地线方程也是非常丰富的。对于平直时空,测地线只能是直线;而对于弯曲时空,测地线则非常丰富多彩,不同的初始条件下,可能产生各种各样丰富多彩的解,也让这个世界充满了各种可能性,但又都是在统一的方程的统治之下。
非线性方程的另一个典型特性就是多稳定性,不同的初始值除了演化的轨迹非常不一样,还可能最终演化的终态完全不一样,完全可能导致不同的吸引子。吸引子其实是某种稳定的可观察的状态,对应于某种稳定的结构,而多稳定性就赋予了同一个方程之下可能产生多种不同的稳定结构的可能性。
在希格斯机制里一个物理体系的真空态是由 Lagrangian 所确定的, 为什么会不具有 Lagrangian 所具有的对称性呢? 这其中的奥秘在于许多物理体系具有简并的真空态。这用非线性动力系统的语言则更加清晰明了,一个动力系统的平衡点或吸引子是由动力学方程所确定的,为什么会不具有动力学方程所具有的对称性呢?这其中的奥秘在于有些动力系统具有共存的多个吸引子。
我们希望在最终的统一方程里,希格斯机制不再是为了解决质量起源而人为外部引入的,而是作为深层次原理要求的,由于方程内在的非线性而自发产生的一种多吸引子共存的效应。
对于广义相对论,由于方程的非线性,可能产生黑洞等复杂的解,实际上根据混沌理论的经验,完全可能产生更多更丰富的如黑环、黑吸引子等解。另外,这些解都是一种稳定的简单结构,是否可以作为基本粒子的某种描述,甚至可以找到基本粒子和黑洞之间的某些联系。
最终的理论并不应该是一种万有理论,即不应该是像现在标准模型一样,把实验已知的各种基本粒子捆绑在一起构成一个万物理论,而是从理论上预言一切的可能性。吸引子本身具有丰富的拓扑结构,足以解释各种基本粒子。我们可能会对所谓基本粒子产生全新的认识,这些基本粒子都可以由某种吸引子,或是吸引子上面的扭结所描述,基本粒子并不基本,而都是在特定能标下的特殊的一些稳定结构。
混沌学里,方程的参数的变化会导致系统动力学发生各种有趣的现象。分岔是指系统参数(分岔参数)小而连续的变化,结果造成系统本质或是拓扑结构的突然改变。所以最终的统一方程,还可能在具体不同的外部参数下产生各种复杂的动力学特性。对具体问题,选取具体的参数来描述具体的系统的特性,而动力学在这些参数变化下会产生分叉等,对应真实问题的各种相变。这就同水在不同温度下可以处于冰(固相)、水(液相)、汽(汽相)几种不同的物相类似。而我们知道,在一定温度下,水的几种相可以相互转变。与此类似,上面所说的吸引子代表了特定条件下的特殊的一些稳定结构,而某些关键参数就代表了这些“特定条件”,在这些参数的变化下就会发生真实世界里普遍存在的“分叉”、“突变”、“相变”。
在一定条件下,不同的真空相也会彼此转变,这就是真空的相变。不同类型的相互作用可以导致不同类型真空的状态,那么对同一种相互作用,在不同的条件下也可能出现不同类型的真空态。这些不同的真空状态,在物理学上叫做不同的“真空相”。
最后,混沌理论告诉我们,当考虑到大量复杂个体的相互作用时,即便每个个体都是由简单的方程所决定,系统整体还是会涌现出非常复杂的行为。更何况统一方程是一个复杂深刻简洁的方程,就可以涌现出更多丰富多彩的现象了。
可以预见,最终的统一方程将具有更强的非线性和复杂性,爱因斯坦场方程只是统一方程的一个特殊的近似形式。所以即便最终的方程被发现了,也不意味着理论物理就终结了,只是研究的方向从以前的自下而上,变成了以后的自上而下。事实上光方程的求解就可以继续研究几百年了,而且可能要借助计算机技术的发展后产生的巨大算力和人工智能技术来辅助。未来的物理学将由原理方程出发,结合计算机建模模拟,结合海量数据分析,来解决各种具体问题,解决以前认为只能是理论上可解的各种复杂问题,物理学方程和高深的数学理论将更加深度地参与到材料化学生物社会等各个领域,那将是物理方程力量的更大体现,将原理之光照亮科学的各个角落。
图,对称的方程,对称地产生了两个不对称的吸引子,非线性系统对称性自发破缺
我们可以一般地把Lagrangian写为如下形式:
\begin{equation}
\mathcal{L}=\left(\partial_{\mu} \Phi\right)^{\dagger}\left(\partial^{\mu} \Phi\right)-V(\Phi)
\end{equation}
其中$\Phi $是N维内部空间的列矢量。我们假定势能$V(\Phi)$在$\Phi=\Phi_{0}$有局域的极小,即:
\begin{equation}
\left.\frac{\partial V(\Phi)}{\partial \Phi_{a}}\right|_{\Phi=\Phi_{0}}=0,
\quad \text { for } a=1,2, \cdots, N
\end{equation}
将场在此平衡点附近展开,从而势能可以展开成:
\begin{equation}
V(\Phi)=V\left(\Phi_{0}\right)+\frac{1}{2}
M_{ab}\left(\Phi-\Phi_{0}\right)^{a}\left(\Phi-\Phi_{0}\right)^{b}
+\mathcal{O}\left(\left(\Phi-\Phi_{0}\right)^{3}\right)
\end{equation}
因为$\Phi=\Phi_{0}$是极小点,所以相应的质量矩阵必定是非负的,
\begin{equation}
M_{ab}=\left.\frac{\partial^{2}V(\Phi)}{\partial\Phi_{a}\partial \Phi_{b}}\right|_{\Phi=\Phi_{0}} \geq 0
\end{equation}
我们要求Lagrangian在N维内部空间转动下不变,这表示,在如下变换下
\begin{equation}
\Phi \rightarrow \Phi^{\prime}=U \Phi=\exp \left(i \theta_{c} T^{c}\right) \Phi
\end{equation}
Lagrangian是不变的。从而我们可以得到:
\begin{equation}
\begin{aligned} V(\Phi) &=V\left(\Phi^{\prime}\right) \\ &
=V\left(\Phi_{0}\right)+\frac{1}{2} M_{ab} \delta \Phi^{a} \delta \Phi^{b}+\cdots \end{aligned}
\end{equation}
其中,$\delta \Phi$为$\Phi_{0}$满足上述条件的转动变换,则有
\begin{equation}
M_{a b} \delta \Phi^{a} \delta \Phi^{b}=0
\end{equation}
当且仅当$\delta \Phi^{a}=\delta \Phi^{b}=0$时,才可能有$M_{a b} \neq 0$。若$\delta \Phi^{a}$与$\delta \Phi^{b}$都不为零,则必有$M_{a b}=0$,
\begin{equation}
\begin{array}{l}{M_{a b}=0} \\
{\delta \Phi^{a} \neq 0} \\ {\delta \Phi^{b} \neq 0}\end{array}
\end{equation}
$\delta \Phi^{a}$不为零,意味着真空在这一维是简并的,对称性自发破缺,$\Phi_{0}^{a}$的转动不变性丧失,则有$M_{a a}=0$,与$\Phi^{a}$相应的物理场质量为零。这就是Goldstone 定理。上述分析同时还表明,质量矩阵为零的维数,即Goldstone粒子的数目$N_{G}$,等于真空的对称性发生破缺的维数。而有质量的粒子书目,即Higgs粒子的数目。一般来说等于$N-N_{G}$。
以下是详细的希格斯机制的数学表述,我们可以看出真空的定义,多稳定性起了决定性作用。
1)U(1)规范中的拉氏量为
\begin{equation}
\mathcal{L}_{(1)}=\left(D_{\mu} \Phi\right)^{\dagger}\left(D^{\mu} \Phi\right)-\frac{1}{4} F_{\mu \nu} F^{\mu \nu}-V(\Phi)
\end{equation}
其中,$D^{\mu}=\left(\partial^{\mu}-i g A^{\mu}\right), \quad F_{\mu \nu}=\partial_{\mu} A_{\nu}-\partial_{\nu} A_{\mu}, \quad V(\Phi)=\mu^{2} \Phi^{\dagger} \Phi+\lambda\left(\Phi^{\dagger} \Phi\right)^{2}, \quad \lambda>0$且$\Phi=\frac{1}{\sqrt{2}}\left(\Phi_{1}+i \Phi_{2}\right)$,$\Phi_{1}$,$\Phi_{2}$是实场。
标量场变换为
\begin{equation}
\Phi \rightarrow e^{-i \alpha(x)} \Phi
\end{equation}
规范场的变换为
\begin{equation}
A_{\mu} \rightarrow A_{\mu}-\frac{1}{g} \partial_{\mu} \alpha(x)
\end{equation}
此为U(1)定域变换。
2)前面已经证明$\mathcal{L}_{(1)}$在U(1)定域规范变换下是不变的,接下来我们要证明的是希格斯场的真空在U(1)变换下不为零,即发生了SSB.
这里的$V(\Phi)$类比先前提到的铁磁体情况:希格斯的真空为$|\langle \Phi \rangle|=\sqrt{\frac{-\mu^{2}}{2 \lambda}} \neq 0$,真空破缺,当选择$\langle \Phi \rangle $的辐角为0时,得到$\langle \Phi_{1} \rangle=\sqrt{\frac{-\mu^{2}}{ \lambda}} = v$,$\langle \Phi_{1} \rangle=0$。此时$\mathcal{L}_{(1)}$表示的系统是定域规范破缺对称的。于是,我们对新的场改变坐标
\begin{equation}
\Phi_{1}^{\prime} \equiv \Phi_{1}-v ; \Phi_{2}^{\prime} \equiv \Phi_{2}
\end{equation}
这样变换的目的为使得真空为0,即$<\Phi_{1}^{\prime}>=0,<\Phi_{2}^{\prime}>=0$。
我们看看这种局域规范对称的破缺会带来什么样的效应。
将$\Phi_{1,2}^{\prime}$代入原式
\begin{equation}
\begin{aligned}\left(D_{\mu}
\Phi\right)^{\dagger}\left(D^{\mu} \Phi\right) &\left.=\left[\left(\partial_{\mu}+i g A_{\mu}\right) \frac{1}{\sqrt{2}}\left(\Phi_{1}-i \Phi_{2}\right)\right]\left[\left(\partial^{\mu}-i g A^{\mu}\right) \frac{1}{\sqrt{2}}\left(\Phi_{1}+i \Phi_{2}\right)\right)\right] \\ &=\frac{1}{2}\left[\left(\partial_{\mu}+i g A_{\mu}\right)\left(\Phi_{1}^{\prime}+v-i \Phi_{2}^{\prime}\right)\right]\left[\left(\partial^{\mu}-i g A^{\mu}\right)\left(\Phi_{1}^{\prime}+v+i \Phi_{2}^{\prime}\right)\right]
\end{aligned}
\end{equation}
\begin{equation}
\begin{aligned}=& \frac{1}{2}\left[\partial_{\mu}\left(\Phi_{1}^{\prime}+v-i \Phi_{2}^{\prime}\right)+i g A_{\mu}\left(\Phi_{1}^{\prime}+v-i \Phi_{2}^{\prime}\right)\right] \\ & \times\left[\partial^{\mu}\left(\Phi_{1}^{\prime}+v+i \Phi_{2}^{\prime}\right)-i g A^{\mu}\left(\Phi_{1}^{\prime}+v+i \Phi_{2}^{\prime}\right)\right] \\=& \frac{1}{2}\left(\partial_{\mu} \Phi_{1}^{\prime}-i \partial_{\mu} \Phi_{2}^{\prime}+i g A_{\mu} \Phi_{1}^{\prime}+i g A_{\mu} v+g A_{\mu} \Phi_{2}^{\prime}\right) \\ & \times\left(\partial^{\mu} \Phi_{1}^{\prime}+i \partial^{\mu} \Phi_{2}^{\prime}-i g A^{\mu} \Phi_{1}^{\prime}-i g A^{\mu} v+g A^{\mu} \Phi_{2}^{\prime}\right) \\=& \frac{1}{2}\left[\left(\partial_{\mu} \Phi_{1}^{\prime}+g A_{\mu} \Phi_{2}^{\prime}\right)-i\left(\partial_{\mu} \Phi_{2}^{\prime}-g A_{\mu} \Phi_{1}^{\prime}\right)+i g A_{\mu} v\right] \end{aligned}
\end{equation}
\begin{equation}
\begin{array}{l}{ \times\left[\left(\partial^{\mu} \Phi_{1}^{\prime}+g A^{\mu} \Phi_{2}^{\prime}\right)+i\left(\partial^{\mu} \Phi_{2}^{\prime}-g A^{\mu} \Phi_{1}^{\prime}\right)-i g A^{\mu} v\right]} \\ {=\frac{1}{2}\left[\left(\partial_{\mu} \Phi_{1}^{\prime}+g A_{\mu} \Phi_{2}^{\prime}\right)\left(\partial^{\mu} \Phi_{1}^{\prime}+g A^{\mu} \Phi_{2}^{\prime}\right)+i\left(\partial_{\mu} \Phi_{1}^{\prime}+g A_{\mu} \Phi_{2}^{\prime}\right)\right.} \\ {\left. \times\left(\partial^{\mu} \Phi_{2}^{\prime}-g A^{\mu} \Phi_{1}^{\prime}\right)\right]-i\left(\partial_{\mu} \Phi_{1}^{\prime}+g A_{\mu} \Phi_{2}^{\prime}\right) g A^{\mu} v} \\ {-i\left(\partial_{\mu} \Phi_{2}^{\prime}-g A_{\mu} \Phi_{1}^{\prime}\right)\left(\partial^{\mu} \Phi_{1}^{\prime}+g A^{\mu} \Phi_{2}^{\prime}\right)} \\ {+\left(\partial_{\mu} \Phi_{2}^{\prime}-g A_{\mu} \Phi_{1}^{\prime}\right)\left(\partial^{\mu} \Phi_{2}^{\prime}-g A^{\mu} \Phi_{1}^{\prime}\right)-\left(\partial_{\mu} \Phi_{2}^{\prime}-g A_{\mu} \Phi_{1}^{\prime}\right) g A^{\mu} v} \\ {\quad+i g A_{\mu} v\left(\partial^{\mu} \Phi_{1}^{\prime}+g A^{\mu} \Phi_{2}^{\prime}\right)-g A_{\mu} v\left(\partial^{\mu} \Phi_{2}^{\prime}-g A^{\mu} \Phi_{1}^{\prime}\right)+g^{2} v^{2} A_{\mu} A^{\mu}}\end{array}
\end{equation}
\begin{equation}
\begin{aligned}=& \frac{1}{2}\left[\left(\partial_{\mu} \Phi_{1}^{\prime}+g A_{\mu} \Phi_{2}^{\prime}\right)^{2}+\left(\partial_{\mu} \Phi_{2}^{\prime}-g A_{\mu} \Phi_{1}^{\prime}\right)^{2}\right.\\ &\left.-2 g A^{\mu} v\left(\partial_{\mu} \Phi_{2}^{\prime}-g A_{\mu} \Phi_{1}^{\prime}\right)+g^{2} v^{2} A_{\mu} A^{\mu}\right] \\=& \frac{1}{2}\left(\partial_{\mu} \Phi_{1}^{\prime}+g A_{\mu} \Phi_{2}^{\prime}\right)^{2}+\frac{1}{2}\left(\partial_{\mu} \Phi_{2}^{\prime}-g A_{\mu} \Phi_{1}^{\prime}\right)^{2} \\ &-g A^{\mu} v\left(\partial_{\mu} \Phi_{2}^{\prime}-g A_{\mu} \Phi_{1}^{\prime}\right)+\frac{1}{2} g^{2} v^{2} A_{\mu} A^{\mu} \end{aligned}
\end{equation}
此时系统的真空为0,即系统是对称的。上式最后一项表明规范场$A_{\mu} A^{\mu}$获得质量。虽然使得规范场获得了质量,当然,上式并不是物理的,因为有一项非物理的混合项,即$-g A^{\mu} v\left(\partial_{\mu} \Phi_{2}^{\prime}-g A_{\mu} \Phi_{1}^{\prime}\right)$,此项是规范玻色子和标量场的混合项。为得到真实的物理态,该项必须消除。我们可以这样做,通过选择何时的坐标来实现—极坐标,它可以描述真空位形的微小振荡,这就是所谓的“参数化”。
3)“参数化”
我们不再使用实分量$\Phi_{1}(x), \quad \Phi_{2}(x)$表示$\Phi(x)$,而是沿着真空态矢$v$的方向引进实场$\eta(x)$,和沿垂直于真空态矢$v$的方向引进实场$\xi(x)$,按参数化,则
\begin{equation}
\Phi^{\prime \prime}(x)=\frac{1}{\sqrt{2}}(v+\eta(x)) e^{\frac{i\langle x\rangle}{v}}
\end{equation}
\begin{equation}
\left(\Phi^{\prime \prime}(x)\right)^{\dagger}
=\frac{1}{\sqrt{2}} e^{\frac{-i \xi(x)}{v}}(v+\eta(x))
\end{equation}
验证这样引进的新场真空值为0
\begin{equation}
<|\sqrt{\Phi^{\prime \prime \dagger} \Phi^{\prime \prime}}|>=\frac{v}{\sqrt{2}}
\end{equation}
而因为$\operatorname{arg}<\Phi>=0$,因而$<\xi(x)>=0$所以
\begin{equation}
\begin{aligned}<|\sqrt{\Phi^{\prime \dagger} \Phi^{\prime \prime}}|>&=<| \sqrt{\frac{1}{2} e^{\frac{-i \epsilon(z)}{v}}\left(v+\xi(x)\left(v+\xi(x) e^{\frac{i \zeta(z)}{v}} |>\right.\right.} \\ &=\frac{1}{\sqrt{2}}<|\sqrt{v^{2}+2 v \eta+\eta^{2}}|>\end{aligned}
\end{equation}
欲使得它等于上式,则要求$<\eta>=0$。
将新场$\eta(x)$,$\xi(x)$代入$\mathcal{L}_{(1)}$中,则
\begin{equation}
\begin{aligned} \mathcal{L}_{(2)} &=\left(D_{\mu} \Phi^{\prime \prime}\right)^{\dagger}\left(D^{\mu} \Phi^{\prime \prime}\right)-\frac{1}{4} F_{\mu \nu} F^{\mu \nu}-V\left(\Phi^{\prime \prime}\right) \\ &=\left[\left(\partial_{\mu}+i g A_{\mu}\right) \Phi^{\prime \prime \dagger}\right]\left[\left(\partial^{\mu}-i g A^{\mu}\right) \Phi^{\prime \prime}\right]-\frac{1}{4} F_{\mu \nu} F^{\mu \nu}-\left[\mu^{2} \Phi^{\prime \prime \dagger} \Phi^{\prime \prime}+\lambda\left(\Phi^{\prime \prime \dagger} \Phi^{\prime \prime}\right)^{2}\right] \end{aligned}
\end{equation}
\begin{equation}
\begin{aligned}=&\left[\left(\partial_{\mu}+i g A_{\mu}\right) \frac{1}{\sqrt{2}} e^{\frac{-i \xi}{v}}(v+\eta)\right]\left[\left(\partial^{\mu}-i g A^{\mu}\right) \frac{1}{\sqrt{2}}(v+\eta) e^{\frac{i \xi}{v}}\right]-\frac{1}{4} F_{\mu \nu} F^{\mu \nu} \\ &-\mu^{2} \frac{1}{\sqrt{2}} e^{\frac{-i \xi}{v}}(v+\eta) \frac{1}{\sqrt{2}}(v+\eta) e^{\frac{i \xi}{v}}-\lambda\left[\frac{1}{\sqrt{2}} e^{\frac{-i \xi}{v}}(v+\eta) \frac{1}{\sqrt{2}}(v+\eta) e^{\frac{i \xi}{v}}\right]^{2} \end{aligned}
\end{equation}
\begin{equation}
\begin{aligned}=& \frac{1}{2}\left[\partial_{\mu}\left(e^{\frac{-i \xi}{v}}(v+\eta)\right)+i g A_{\mu} e^{\frac{-i \xi}{v}}(v+\eta)\right]\left[\partial^{\mu}\left((v+\eta) e^{\frac{i \xi}{v}}\right)-i g A^{\mu}(v+\eta) e^{\frac{i \epsilon}{v}}\right] \\ &-\frac{1}{4} F_{\mu \nu} F^{\mu \nu}-\frac{1}{2} \mu^{2}(v+\eta)^{2}-\frac{1}{4} \lambda(v+\eta)^{4} \end{aligned}
\end{equation}
\begin{equation}
\begin{aligned}=& \frac{1}{2}\left[\partial_{\mu}\left(e^{\frac{-i \zeta}{r}} v\right)+\partial_{\mu}\left(e^{\frac{-i \xi}{*}} \eta\right) i g A_{\mu}(v+\eta) e^{\frac{-i \xi}{v}}\right] \\ & \times\left[\partial^{\mu}\left(v e^{\frac{i \xi}{v}}\right)+\partial^{\mu}\left(\eta e^{\frac{i 5}{v}}\right)-i g A^{\mu}(v+\eta) e^{\frac{i \xi}{r}}\right] \\ &-\frac{1}{4} F_{\mu \nu} F^{\mu \nu}-\frac{1}{2} \mu^{2}\left(v^{2}+2 v \eta+\eta^{2}\right)-\frac{1}{4} \lambda\left(v^{4}+4 v^{3} \eta+6 v^{2} \eta^{2}+4 v \eta^{3}+\eta^{4}\right) \end{aligned}
\end{equation}
\begin{equation}
\begin{array}{l}{=\frac{1}{2}\left[v\left(-\frac{i}{v}\right) e^{-\frac{i \xi}{v}} \partial_{\mu} \xi+\eta\left(-\frac{\xi}{v}\right) e^{-\frac{i \xi}{v}} \partial_{\mu} \xi+e^{-\frac{i \zeta}{v}} \partial_{\mu} \xi+i g A_{\mu}(v+\eta) e^{-\frac{i s}{v}}\right]} \\ { \times\left[v\left(\frac{i}{v}\right) e^{\frac{i}{v}} \partial^{\mu} \xi+\eta\left(\frac{i}{v}\right) e^{\frac{i \zeta}{v}} \partial^{\mu} \xi+e^{\frac{i \zeta}{v}} \partial^{\mu} \xi-i g A^{\mu}(v+\eta) e^{\frac{\omega}{v}}\right]} \\ {\quad-\frac{1}{4} F_{\mu \nu} F^{\mu \nu}+\left(\frac{1}{2} \lambda v^{2} v^{2}+\frac{1}{2} \lambda v^{2} 2 v \eta+\frac{1}{2} \lambda v^{2} \eta^{2}\right)} \\ {\quad-\left(\frac{1}{4} \lambda v^{4}+\frac{1}{4} \lambda 4 v^{3} \eta+\frac{1}{4} \lambda 6 v^{2} \eta^{2}+\frac{1}{4} \lambda 4 v \eta^{3}+\frac{1}{4} \lambda \eta^{4}\right)}\end{array}
\end{equation}
\begin{equation}
\begin{array}{l}{=\frac{1}{2}\left[-i \partial_{\mu} \xi-i \frac{\eta}{v} \partial_{\mu} \xi+\partial_{\mu} \eta+i g A_{\mu}(v+\eta)\right] e^{-\frac{i \xi}{v}}} \\ {e^{\frac{i \xi}{v}}\left[i \partial^{\mu} \xi+i \frac{\eta}{v} \partial^{\mu} \xi+\partial^{\mu} \eta-i g A^{\mu}(v+\eta)\right]} \\ {\quad-\frac{1}{4} F_{\mu \nu} F^{\mu \nu}+\left(\frac{1}{2} \lambda v^{4}+\lambda v^{3} \eta+\frac{1}{2} \lambda v^{2} \eta^{2}\right)} \\ {\quad-\left(\frac{1}{4} \lambda v^{4}+\lambda v^{3} \eta+\frac{3}{2} \lambda v^{2} \eta^{2}+\lambda v \eta^{3}+\frac{1}{4} \lambda \eta^{4}\right)}\end{array}
\end{equation}
\begin{equation}
\begin{aligned}=& \frac{1}{2}\left[\partial_{\mu} \xi \partial^{\mu} \xi+\frac{\eta}{v} \partial_{\mu} \xi \partial^{\mu} \xi-i \partial_{\mu} \xi \partial^{\mu} \eta-\partial_{\mu} \xi g A^{\mu}(v+\eta)\right.\\ &+\frac{\eta}{v} \partial_{\mu} \xi \partial^{\mu} \xi+\frac{\eta^{2}}{v^{2}} \partial_{\mu} \xi \partial^{\mu} \xi-i \frac{\eta}{v} \partial_{\mu} \xi \partial^{\mu} \eta-\frac{\eta}{v} \partial_{\mu} \xi g A^{\mu}(v+\eta) \\ &+i \partial_{\mu} \eta \partial^{\mu} \xi+i \frac{\eta}{v} \partial_{\mu} \eta \partial^{\mu} \xi+\partial_{\mu} \eta \partial^{\mu} \eta-i \partial_{\mu} \eta g A^{\mu}(v+\eta) \\ &-g A_{\mu}(v+\eta) \partial^{\mu} \xi-g A_{\mu}(v+\eta) \frac{\eta}{v} \partial^{\mu} \xi+i g A_{\mu}(v+\eta) \partial^{\mu} \eta-\frac{1}{4} F_{\mu \nu} F^{\mu \nu} \\ &\left.+g A_{\mu}(v+\eta) g A^{\mu}(v+\eta)+\frac{1}{4} \lambda v^{4}-\lambda v^{2} \eta^{2}-\lambda v \eta^{3}-\frac{1}{4} \lambda \eta^{4}\right] \end{aligned}
\end{equation}
\begin{equation}
\begin{aligned}=& \frac{1}{2}\left[\partial_{\mu} \xi \partial^{\mu} \xi+2 \frac{\eta}{v} \partial_{\mu} \xi \partial^{\mu} \xi-2 g A^{\mu}(v+\eta) \partial_{\mu} \xi+\frac{\eta^{2}}{v^{2}} \partial_{\mu} \xi \partial^{\mu} \xi\right.\\ &\left.-2 \frac{\eta}{v} g A^{\mu}(v+\eta) \partial_{\mu} \xi+\partial_{\mu} \eta \partial^{\mu} \eta+g^{2}(v+\eta)^{2} A_{\mu} A^{\mu}\right] \\ &-\frac{1}{4} F_{\mu \nu} F^{\mu \nu}-\frac{1}{4} \mu^{2} v^{2}+\mu^{2} \eta^{2}-\lambda v \eta^{3}-\frac{1}{4} \lambda \eta^{4} \end{aligned}
\end{equation}
\begin{equation}
\begin{aligned}=& \frac{1}{2}\left[\left(1+2 \frac{\eta}{v}+\frac{\eta^{2}}{v^{2}}\right) \partial_{\mu} \xi \partial^{\mu} \xi-\left(1+\frac{\eta}{v}\right) 2 g A^{\mu}(v+\eta) \partial_{\mu} \xi+\partial_{\mu} \eta \partial^{\mu} \eta\right.\\ &\left.+g^{2}(v+\eta)^{2} A_{\mu} A^{\mu}\right]-\frac{1}{4} F_{\mu \nu} F^{\mu \nu}-\frac{1}{4} \mu^{2} v^{2}+\mu^{2} \eta^{2}-\lambda v \eta^{3}-\frac{1}{4} \lambda \eta^{4} \\=& \frac{1}{2}\left[\left(1+\frac{\eta}{v}\right)^{2} \partial_{\mu} \xi \partial^{\mu} \xi-2 g \frac{1}{v}(v+\eta)^{2} A^{\mu} \partial_{\mu} \xi+\partial_{\mu} \eta \partial^{\mu} \eta\right.\\ &\left.+g^{2}(v+\eta)^{2} A_{\mu} A^{\mu}\right]-\frac{1}{4} F_{\mu \nu} F^{\mu \nu}-\frac{1}{4} \mu^{2} v^{2}+\mu^{2} \eta^{2}-\lambda v \eta^{3}-\frac{1}{4} \lambda \eta^{4} \end{aligned}
\end{equation}
\begin{equation}
\begin{aligned} \approx & \frac{1}{2}\left[\partial_{\mu} \eta \partial^{\mu} \eta+\partial_{\mu} \xi \partial^{\mu} \xi-2 g v A^{\mu} \partial_{\mu} \xi+g^{2} v^{2} A_{\mu} A^{\mu}\right] \\ &-\frac{1}{4} F_{\mu \nu} F^{\mu \nu}+\mu^{2} \eta^{2}-\lambda v \eta^{3}-\frac{1}{4} \lambda \eta^{4} \end{aligned}
\end{equation}
此时$\mathcal{L}_{(2)}$描述的系统,其真空是对称的,但是其运动规律不再对称。由$\mathcal{L}_{(2)}$的最后表达式可知,$\eta$场有实质量,$m_{\eta}=\sqrt{-2 \mu^{2}}$,规范场$A_{\mu}$也有质量,$m_{A_{\mu}}=gv$,但是$\xi$场仍然没有质量,从后面的推导可知,它是戈德斯通玻色子。并且在$\mathcal{L}_{(2)}$的表达式中出现了$\xi$和$A_{\mu}$直接耦合项,这是我们不希望有的,要想法消去。那就是接下来要介绍的幺正规范。
4)“幺正规范”
作幺正规范:
\begin{equation}
\Phi^{\prime \prime \prime}(x)=e^{\frac{-i \xi(x)}{v}} \eta^{\prime \prime}(x)=\frac{1}{\sqrt{2}}(v+\eta(x))
\end{equation}
\begin{equation}
\left(\Phi^{\prime \prime \prime}(x)\right)^{\dagger}=\left(\eta^{\prime \prime}(x)\right)^{\dagger} e^{\frac{i \epsilon(x)}{v}}=\frac{1}{\sqrt{2}}(v+\eta(x))
\end{equation}
\begin{equation}
A_{\mu}(x)=A_{\mu}(x)-\frac{1}{g v} \partial_{\mu} \xi(x) \equiv B_{\mu}(x)
\end{equation}
将上述幺正规范替换$\mathcal{L}_{(1)}$中对应的物理量:
\begin{equation}
\begin{aligned}
\mathcal{L}_{(3)}=&\left[\left(\partial_{\mu}+i g B_{\mu}\right)\left(\Phi^{\prime \prime \prime}\right)^{\dagger}\right]\left[\left(\partial^{\mu}-i g B^{\mu}\right) \Phi^{\prime \prime \prime}\right] \\ &-\frac{1}{4} F_{\mu \nu}^{\prime} F^{\prime \mu \nu}-\left[\mu^{2}\left(\Phi^{\prime \prime \prime}\right)^{\dagger} \Phi^{\prime \prime \prime}+\lambda\left(\left(\Phi^{\prime \prime \prime}\right)^{\dagger} \Phi^{\prime \prime \prime}\right)^{2}\right] \end{aligned}
\end{equation}
\begin{equation}
\begin{aligned}=&\left[\left(\partial_{\mu}+i g B_{\mu}\right) \frac{1}{\sqrt{2}}(v+\eta)\right]\left[\left(\partial^{\mu}-i g B^{\mu}\right) \frac{1}{\sqrt{2}}(v+\eta)\right]-\frac{1}{4} F_{\mu \nu}^{\prime} F^{\prime \mu \nu} \\ &-(\mu)^{2} \frac{1}{\sqrt{2}}(v+\eta) \frac{1}{\sqrt{2}}(v+\eta)-\lambda\left[\frac{1}{\sqrt{2}}(v+\eta) \frac{1}{\sqrt{2}}(v+\eta)\right]^{2} \\=& \frac{1}{2}\left[\partial_{\mu} \eta+i g B_{\mu}(v+\eta)\right]\left[\partial^{\mu} \eta-i g B^{\mu}(v+\eta)\right]-\frac{1}{4} F_{\mu \nu}^{\prime} F^{\prime \mu \nu} \\ &-\frac{1}{2} \mu^{2}(v+\eta)^{2}-\frac{1}{4} \lambda(v+\eta)^{2} \end{aligned}
\end{equation}
\begin{equation}
\begin{aligned}=& \frac{1}{2}\left[\partial_{\mu} \eta \partial^{\mu} \eta-i \partial_{\mu} \eta g B^{\mu}(v+\eta)+i g B_{\mu}(v+\eta) \partial^{\mu} \eta\right.\\ &\left.+g^{2}(v+\eta)^{2} B_{\mu} B^{\mu}\right]-\frac{1}{4} F_{\mu \nu}^{\prime} F^{\mu \nu}+\mu^{2} \eta^{2}-\lambda v \eta^{3}-\frac{1}{4} \lambda \eta^{4} \\=& \frac{1}{2}\left(\partial_{\mu} \eta\right)^{2}+\mu^{2} \eta^{2}-\frac{1}{4}\left(\partial_{\mu} B_{\nu}-\partial_{\nu} B_{\mu}\right)^{2}+\frac{1}{2} g^{2} v^{2} B_{\mu} B^{\mu} \\ &+\frac{1}{2} g^{2} \eta(2 v+\eta) B_{\mu} B^{\mu}-\lambda v \eta^{3}-\frac{1}{4} \lambda \eta^{4} \end{aligned}
\end{equation}
其中$F_{\mu \nu}^{\prime}=\partial_{\mu} B_{\nu}-\partial_{\nu} B_{\mu}$。
从$\mathcal{L}_{(3)}$可以看出来,它是具有物理意义的。它描述了自旋为1,带有质量的规范玻色子$B_{\mu}$,其质量为$m_{B_{\mu}}=g v$和一个自旋为0,有质量的标量玻色子$\eta$,$m_{\eta}=\sqrt{2}|\mu|$,中间过程中出现的戈德斯通玻色子场$\xi$消失了,此处的$\eta$就是希格斯玻色子。
以上非常简单的例子完整地介绍了希格斯机制的具体内容。现在我们总结一下希格斯机制的一般性质:1,相互作用的规范对称性是守恒的;2,无质量规范理论满足重整化;3,极化自由度的总数是守恒的。例如先前提到的在U(1)规范变换中,SSB之前总的极化自由度=4=(2个$A_{\mu}$)+(2个$\Phi$),而在SSB之后,总的极化自由度=4=(3个$B_{\mu}$)+(1个$\eta$);4,非物理场,即可能的GBs在物理谱中消失了,在U(1)情况即为$\xi(x)$;5,获得质量的规范玻色子数目=可能的GBs数目=对称性自发破缺的数目,在U(1)情况数目为1:6,可能的GBs和无质量的规范玻色子结合使之获得质量。这种结合在U(1)情况即为混合项$g v A^{\mu} \partial_{\mu} \Phi_{2}^{\prime}$;7,需要注意的是,希格斯机制本身并不能预言希格斯粒子的存在。它只在极化自由度守恒这一性质所要求时才出现。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-25 08:56
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社