博文

利用聚类树聚合方法挖掘生物医学数据特征挖掘（摘要翻译）

已有 3231 次阅读 2018-7-21 12:08 |个人分类:生物信息学|系统分类:科研笔记| 数据挖掘, 生物医学, 聚类树, 数据特征提取

Mining Features for Biomedical Data using Clustering Tree Ensembles.

J Biomed Inform. 2018 Jul 13;

可以供给机器学习界利用的生物医学数据量增长非常迅速，随之带来一个问题：这些数据实际上能提供多少信息的？或者描述数据实例的特征有多大的区分度？一些生物医学数据集受到实例的表示上缺乏差异，更有甚者，有些数据集里还有具有相同特征和不同类标签的实例存在。毫无疑问，这直接影响机器学习算法的性能，以及解释其结果的能力。本文聚焦于上述问题，并提出一种基于树集合学习（tree ensemble learning）的目标通知特征归纳（target-informed feature induction）方法。该方法为数据表示带来更多变化，从而可能增加应用于特征归纳的学习机的预测性能。本文有双重作用：首先，强调了影响生物医学数据质量的问题；其次，提出了一种处理该问题的方法。所提出的方法的效率在多目标预测任务上得到验证。结果表明，所提出的方法能够增强数据实例之间的区分并提高预测性能。

DOI: 10.1016/j.jbi.2018.07.012

PMID: 30012356

转载本文请联系原作者获取授权，同时请注明本文来自崔雷科学网博客。
链接地址：https://blog.sciencenet.cn/blog-82196-1125207.html

上一篇：Bicomb软件处理pubmed的xml格式中出现问题的临时解决办法
下一篇：喜欢做的和必须做的，为什么不能任性呢？

崔雷的窗口分享 http://blog.sciencenet.cn/u/zilu85 我在专业领域里的感受

博文

利用聚类树聚合方法挖掘生物医学数据特征挖掘（摘要翻译）

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

崔雷

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

崔雷的窗口分享 http://blog.sciencenet.cn/u/zilu85 我在专业领域里的感受

博文

利用聚类树聚合方法挖掘生物医学数据特征挖掘（摘要翻译）

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

崔雷

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

该博文允许注册用户评论请点击登录评论 (0 个评论)