||
在数据驱动型研究论文中,大量算法正被提出、改进或使用。从论文全文内容中识别出算法并进行学术影响力评价,可以确定该领域流行的、经典的乃至新兴的算法,帮助初学者对特定领域算法有较为全面的了解。为此,我们以自然语言处理(NLP)领域为例,对1979~2015年间NLP领域顶级会议ACL全文内容中提及的算法实体进行标注,并构建算法词典;基于算法被提及频次和每年发表文章数,获取不同算法实体的年度学术影响力,进而得到算法实体在NLP领域的总影响力。我们还根据算法所在论文发表时间,分析算法学术影响力随时间演变的不同模式,并指出算法影响力演化反映了该领域研究任务和课题的变化。从演化图(https://chengzhizhang.github.io/research/algorithm_entity/algorithm_influence.html,在线mp4视频:https://chengzhizhang.github.io/research/algorithm_entity/video.html )可以明显看出,在NLP领域,1995年是个重要的时间节点,即机器学习方法逐渐成为主流;SVM从2005年开始独领风骚近十年,直到2015年;2015年开始,以神经网络为基础的深度学习算法成为主流。这项研究目前发表于Journal of Informetrics。
参考文献:
Yuzhuo Wang, Chengzhi Zhang*. Using the Full-text Content of Academic
Articles to Identify and Evaluate Algorithm Entities in the Domain of
Natural Language Processing. Journal of Informetrics, 2020, 14(2): 101091.[doi] [Demo: Algorithm Influence in NLP (1979~2015)] [Video]
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-26 20:01
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社