|
2015年,备受世人瞩目的引力波探测首次取得成功。由此LIGO科学团队的三位代表人获得了2017年的诺贝尔物理学奖。随后,更多的双致密天体并合引力波事件被LIGO探测到,引力波天文学得到了前所未有的蓬勃发展。然而,大量引力波事件的数据处理任务对现有的匹配滤波(Matched Filtering)技术来说是个巨大的挑战。因此,一项擅长大数据处理的机器学习方法——深度学习,开始尝试在该领域中发挥作用。它将开启引力波智能观测的新时代。
引力波及其探测
引力的本质是时空弯曲。引力波是时空弯曲中的涟漪,通过波的形式传播。引力波携带能量,引力波源通过引力波向外辐射能量,因此引力波又称为引力辐射。现阶段能被实验仪器直接观测到的的引力波源主要是双致密天体的并合。截至目前为止,由LIGO直接探测到的源于双致密天体合并的引力波事件已有多例。
被LIGO探测到的双致密天体并合引力波事件
(图片来源:https://www.ligo.org/index.php)
影响引力波探测能力的关键在于设备的灵敏度和理论模型。由于双致密天体并合释放引力波的理论波形得到了很好的模拟,因此目前采用的匹配滤波进行相关的数据处理可以实现引力波此类弱信号提取和波源参数估计。但是匹配滤波需要很大的计算量,相应的处理速度就会很慢。目前,在LIGO探测器上使用匹配滤波对一例引力波事件进行数据处理需要数周甚至更长的时间。所以当愈来愈多引力波事件等待观测确认时,我们采用了效率更高、学习和范化能力更强的深度学习,来进行引力波的信号识别和波源参数估计。
深度学习
深度学习源于人工神经网络的研究。此概论由Hinton等人于2006年提出。它是机器学习中一种基于对数据进行表征学习的方法,可以实现监督学习和非监督学习。常见的卷积神经网络就是一种深度的监督学习下的机器学习模型。
卷积神经网络的基本结构
(图片来源:http://www.cnblogs.com/sxron/articles/6502116.html)
与传统机器学习过程类似,神经网络实现深度学习主要包括以下三步:
深入分析实际问题的数据结构,选择一个合适的神经网络模型;
依据具体问题,选择相应的损失函数,衡量模型当前参数下的预测结果与真实值之间的差距。
恰当地划分训练集(利用梯度下降算法训练网络),验证集(避免过拟合),测试集(检验网络的范化能力),从而寻找到最佳参数(即当损失函数最小时对应的模型参数)。
梯度下降算法原理,J (theta_0, theta_1)为损失函数,theta_0, theta_1为模型参数
(图片来源:http://www.myexception.cn/other/2077974.html)
深度学习在引力波数据观测中的具体应用
发表在Science China-Physics, Mechanics & Astronomy 2019年第6期的文章“Applying deep neural networks to the detection and space parameter estimation of compact binary coalescence with anetwork of gravitational wave detectors”(主要作者信息:李瑾,重庆大学物理学院;范锡龙,武汉大学物理科学与技术学院)详细讨论了如何利用多层卷积神经网络实现LIGO引力波时域模拟信号(双黑洞合并引力辐射)的识别和波源参数估计。该文的主要工作有:
1 引力波模拟数据集的构建
利用有效一体模型给出的双黑洞并合引力波理论波形,模拟出了大量的时序引力波信号;同时根据LIGO各探测器的噪声功率谱,生成了背景高斯噪声。对于同一引力波事件,在LIGO的三个探测器(Hanford,Livingston,Virgo)中可以各自响应出数据流(参见下图)。若干个类似的数据流可以组成训练集、交叉验证集和测试集,进行后续的网络训练和测试。
单个引力波事件的数据流
2 神经网络结构的设计
网络结构的设计主要是确定神经网络的各项超参数,包括:学习率、正则化参数、神经网络的层数、每一个隐层中神经元的个数、学习的回合数Epoch、小批量数据 minibatch的大小、输出神经元的编码方式、代价函数的选择、权重初始化的方法、神经元激活函数的种类、参加训练模型数据的规模。这些超参数的确定是深度学习成败的关键,也是整个工作过程中最耗时的环节。作者通过多次尝试,对比结果的范化性能得到了如下图所示的多层卷积神经网络结构,用于后续的信号识别和参数估计。
该文选择的卷积神经网络结构
3 引力波信号的识别
根据研究表明,通过深度学习能够有效地识别出高斯噪音中的引力波信号。随着引力波信号信噪比的增大,识别的准确率也明显提高。对于单个事例的识别能力可与匹配滤波相当,识别效率明显提高。
深度学习的准确率随信噪比的变化规律(左);深度学习和传统机器学习方法对单例引力波事件的识别效率(右)
4 引力波源的参数估计
估计的参数包括波源的光度距离及其方位等,并分析了探测器个数对该结果的影响。深度学习算法能够在一定程度上提高对引力波源的定位能力。
(a),(b),(c)代表H,HL,HLV对光度距离的估计误差分布;(d)和(e)表示方位角的不确定度;(f)在不同探测器个数下各个参数估计的平均相对误差随信噪比的变化规律
现阶段,由于真实引力波事件的数量不够充足,并且很多波源的理论模型尚待完善,因此深度学习在引力波数据处理中的研究还非常有限。但随着引力波探测水平和人工智能技术的飞速发展,深度学习数据处理的高效性将有望实现引力波及其电磁对应体的实时观测;同时,深度学习的高迁移性将为引力理论的发展给予有力的实验支撑。相信在不久的将来我们会看到引力波天文学的繁荣景象。
原文链接:
X. L. Fan, J. Li, X. Li, Y. H. Zhong, and J. W. Cao, Applying deep neural networks to the detection and space parameter estimation of compact binary coalescence with a network of gravitational wave detectors, Sci. China-Phys. Mech. Astron. 62, 969512 (2019)
http://engine.scichina.com/doi/10.1007/s11433-018-9321-7
《中国科学: 物理学 力学 天文学》(中文版)和SCIENCE CHINA: Physics, Mechanics & Astronomy (SCPMA, 英文版)是中国科学院主管、中国科学院和国家自然科学基金委员会共同主办的综合性学术刊物, 均为月刊。英文版SCPMA被SCI, EI, ADS等数据库收录, 2017年影响因子为2.754, Q1区。中文版被Scopus、《中文核心期刊要目总览》、《中国科学引文数据库》等收录, 以出版热点专题和专辑为主。中英文为两本完全独立的刊物。订阅《中国科学: 物理学 力学 天文学》微信公众号, 手机同步关注最新热点文章、新闻、科技资讯, 请添加微信号SCPMA2014或扫描下方图片关注.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-28 00:05
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社