林墨分享 http://blog.sciencenet.cn/u/ZJUlijiang 分享以科学家为对象的研究论文

博文

科学家未来的学术影响力可预测吗? 精选

已有 5730 次阅读 2020-12-5 09:28 |系统分类:科研笔记

说明:本博客与微信公众号“林墨”同步更新,所有内容均为原创,可授权转载请扫码关注“林墨”公众号。

屏幕快照 2019-08-02 上午7.34.01.png

与不同学术背景的科学家合作有助于提升自己的h指数。浙江工业大学孔祥杰教授团队与美国德州奥斯汀大学丁颖教授团队、大连理工大学夏锋教授团队等合作利用大数据与机器学习技术揭示了这一关键因素。该发现近日被Nature Index专门报道。

李家兴 / 大连理工大学

640.png注:图片来自于Nature Index官网

一直以来,科研人员的科学影响力至关重要,是获得资助、晋升、选择合作者等的重要影响因素。许多学者倾其一生都在努力获得学术成就,以提高科学影响力。

那么,想要扩大自己的科学影响力,应该怎么做呢?

最近,浙江工业大学计算机与科学技术学院教授孔祥杰等发表数据挖掘领域顶级期刊ACM Transactions on Knowledge Discovery from Data (TKDD)上的研究,通过对16万名计算机科学家和物理学家的分析发现,与作者和文章相关的因素对学者的未来h指数影响最大。该研究试图通过5年、8年和10年的h指数来判断哪些因素最能影响科学家未来的学术成就。这项工作得到了研究者的关注,Nature Index网站专门撰文进行了报道。


h指数是衡量研究人员学术成就的指标

 通过h指数分析研究人员的科学影响力是评估资助申请、确定导师和合作者的常见做法。h指数是基于研究人员的文章输出和被引用的时间,被广泛用于衡量他们的生产力和影响力。它是由加州大学物理学家Hirsch在2005年发明的,作为原始引用计数的一种替代方法,用来表彰在一系列论文中拥有良好引用水平的作者的累积成就,而不是“一时的奇迹”。

利用大数据与机器学习技术,孔祥杰等人对微软MAG数据库中8万多名计算机科学家及其发表的10.5万篇文章、APS数据库8万多名物理学家及其发表的9.8万篇文章进行了分析。


h指数的5大主要影响因素

该研究确定了与h指数相关的5大主要影响因素、共35个细化指标,并计算了相关性:

(1)文章

包括科研人员的文章数量,每位合作者的最高、最低、平均引用次数,参考文献的平均引用量,文章之间的相关性等;

(2)期刊

除了使用引用量、PageRank 值来衡量论文的影响力外,其相应期刊的质量也可被用来评价论文的影响力。这些包括期刊的重要度(以期刊的PageRank值来表示。具体计算时,需要首先构建论文-期刊网络,然后借鉴网页重要度的PageRank计算方法来计算期刊的PageRank值),期刊中发表论文的平均引用率,期刊的h值等;

(3)作者

除了以文章为中心的因素外,代表学者属性的因素对其影响力也至关重要。这些包括每位合作者的h指数,合作者的数量,合作者平均h值,合作者间h指数最大值与最低值之差等;

(4)机构

机构对学者影响力的影响也需要进行考虑,因为研究经费或政策问题会显著影响研究人员在科研方面的进展。同时,学者的学术成就也可能受其同事能力的影响,因为他们之间可能会经常分享研究思路和技术。这些包括学者同事的h值、发表文章数量,机构的h值、被引次数的基尼系数、发表文章数量的基尼系数,机构所在国的国内生产总值等;

(5)时间

学者的学术年龄,学者h指数与△t年前的差异等。

文章使用五种因素作为自变量,h指数作为因变量,并训练回归模型进行预测。这里的回归模型不限于线性回归,实际上,文中的重点方法是GBDT和XGBoost,这两个模型是机器学习中常用的模型,可以解决特征与预测标签间存在非线性关系情况下的回归问题,从而解决线性回归不能很好解决的问题。


5大主要因素影响h指数的权重

文章的实验主要有:1)利用特征工程针对各种影响学者学术成就的因素进行分析,2)基于分析结果,利用各组特征对学者h指数进行预测,3)并基于预测结果进一步分析各组特征影响h指数的权重。

文章的目标是想对青年科学家如何提升自己的学术影响力给出一些启示,同时也能够为科研管理者制定政策导向提供理论依据。

结果表明以文章和以作者为中心的因素与学者未来的成功高度相关。并且当使用前40%和100%因子来预测未来的成功时,只存在一些细微的差别。文章进一步分析了在使用前40%因素情况下的具体重要性排序,发现以文章为中心的因素占41.47%的重要性,以作者为中心的因素占25%的重要性,以时间为中心的因素占16.67%的重要性,以期刊和机构为中心的因素占8.33%重要性。同时也发现同一机构学者的h指数非常接近,即科研机构中存在“人以群分”的现象。与不同学术背景的研究者合作有助于提升科学家的h指数。




屏幕快照 2019-08-02 上午8.27.42.png

[1] ACM. The Gene of Scientific Success. https://dl.acm.org/doi/10.1145/3385530[2020-12-01].

[2]Nature Index. Predicting your future h-index. https://www.natureindex.com/news-blog/predicting-future-career-success-researcher-scientific-publishing-h-index[2020-12-01].









fullsizeoutput_58.jpeg



















https://blog.sciencenet.cn/blog-1792012-1261205.html

上一篇:疫情期间,一个5岁以下的娃能让科研人员的工作时间减少17%
下一篇:把已经发表的论文重新投稿,你猜会发生什么
收藏 IP: 211.162.81.*| 热度|

8 王兴 武夷山 黄永义 孙颉 王兴民 郁志勇 杨金波 许培扬

该博文允许注册用户评论 请点击登录 评论 (3 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-19 11:56

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部