|||
机器学习有很多应用。在我们高能实验物理方面,我们经常用它能区分信号和本底。一个典型的问题是,高能物理实验会涉及很多系统误差(特别是在像LHC这样的强子对撞机上寻找微小的信号),而这些系统误差会影响对信号的灵敏度。但是目前,还没有一个成熟的机器学习方法可以把各种各样的系统误差考虑到training当中,并提高信号的显著性。为此,我提出了一种新的基于决策树(decision tree)和统计学里面的“显著性(significance)”概念的方法——QBDT (即将在NIMA上发表)。
算法:https://github.com/xialigang/QBDT
文章:https://arxiv.org/abs/1810.08387
它的核心思想是:把信号显著性(记作Q)当成优化目标,利用Q来控制决策树的生长,定义误判的权重因子(所谓错误判断的惩罚机制),以及作为最后的输出(score)。在计算Q时,我们可以把各种各样的系统误差考虑进去。直接利用最大似然拟合方法得到Q是非常费时费力的。这里利用我以前的一个计算结果,可以得到考虑系统误差的Q的一个近似的解析表达式。
其中的表达式为
这里很多量不解释了,请参考上面的文章。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-1-6 10:26
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社