Hindawi的博客分享 http://blog.sciencenet.cn/u/Hindawi

博文

Hindawi论文精选∣通过简化训练数据改进跨项目缺陷预测法

已有 557 次阅读 2019-6-12 13:36 |系统分类:论文交流

在历史数据有限的项目中采取跨项目缺陷预测(CPDP)已受到广泛关注由于跨项目训练数据的质量较差,现有方法的效果通常不佳。Hindawi旗下期刊Mathematical Problems in Engineering发表了中国作者的最新文章通过简化训练数据改进跨项目缺陷预测法。


本文章研究旨在通过简化训练数据,提出一种改进的跨项目缺陷预测法,这方法被称为TDSelector,兼顾了每个训练实例的相似性和缺陷数量(以缺陷形式表示),证明了本方法的有效性。研究人员首先根据实例相似性和缺陷的线性加权函数建立TDSelector。然后利用逻辑回归分类算法建立实验中使用的基本缺陷预测器。最后分析了各种相似性和缺陷归一化的组合对预测性能的影响,并与现有的两种方法进行比较。作者利用从两个公共存储库收集的14个项目对研究方法展开评估。结果表明,TDSelector的平均表现优于两种基线方法,AUC值分别提高10.6%和4.3%。也就是说,包含缺陷确实有助于为跨项目缺陷预测筛选高质量的训练实例。另一方面,将欧几里得距离与线性归一化相结合是TDSelector的首选方法。另一项实验也表明,直接选择错误较多的实例作为训练数据,可以进一步提高以本方法训练的错误预测器的性能。

阅读原文



http://blog.sciencenet.cn/blog-3411312-1184538.html

上一篇:如何避免被指剽窃?
下一篇:Hindawi论文精选/身高7英尺6英寸的篮球运动员 帮助我们解开极限身高背后的遗传学秘密

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2019-6-26 22:46

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部