xialigang的个人博客分享 http://blog.sciencenet.cn/u/xialigang

博文

一个能够考虑系统误差的用于高能物理分类问题的机器学习算法QBDT

已有 659 次阅读 2019-3-28 22:41 |个人分类:物理妙趣|系统分类:科研笔记| 机器学习, 显著性, 决策树, 似然估计, 拟合


机器学习有很多应用。在我们高能实验物理方面,我们经常用它能区分信号和本底。一个典型的问题是,高能物理实验会涉及很多系统误差(特别是在像LHC这样的强子对撞机上寻找微小的信号),而这些系统误差会影响对信号的灵敏度。但是目前,还没有一个成熟的机器学习方法可以把各种各样的系统误差考虑到training当中,并提高信号的显著性。为此,我提出了一种新的基于决策树(decision tree)和统计学里面的“显著性(significance)”概念的方法——QBDT (即将在NIMA上发表)。


算法:https://github.com/xialigang/QBDT

文章:https://arxiv.org/abs/1810.08387


它的核心思想是:把信号显著性(记作Q)当成优化目标,利用Q来控制决策树的生长,定义误判的权重因子(所谓错误判断的惩罚机制),以及作为最后的输出(score)。在计算Q时,我们可以把各种各样的系统误差考虑进去。直接利用最大似然拟合方法得到Q是非常费时费力的。这里利用我以前的一个计算结果,可以得到考虑系统误差的Q的一个近似的解析表达式。


image.png

其中的表达式为

image.png

这里很多量不解释了,请参考上面的文章。






http://blog.sciencenet.cn/blog-3401446-1170224.html

上一篇:20190322一道数学证明题

1 尤明庆

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2019-5-23 00:55

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部