||
(本文发表于《情报理论与实践》2025年第12期P158-167)
摘要:目的/意义 为了突破传统文献计量方法的局限,为科学突破性创新论文的早期识别提供理论支持和方法论指导。 方法/过程 基于粗糙集方法中的信息表达系统和多样性测度理论,构建多指标特征视角下的科学突破性创新识别模型,并结合机器学习分类器进行识别。 结果/结论 以2000—2024年的“Science”年度突破数据为实证,验证识别模型的有效性,结果表明随机森林模型的识别准确率为0.9105、精确率为0.8624、召回率为0.9792、F1值为0.9171。 创新/局限 基于粗糙集工具和多样性理论,为科学突破性创新的早期识别提供自适应的测度方案,但仅测度了论文的作者、机构、基金、学科和参考文献等外部特征,未能深入内容特征层面。
链接: http://www.itapress.cn/CN/10.16353/j.cnki.1000-7490.2025.12.016
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-12-17 03:07
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社