章成志 分享 http://blog.sciencenet.cn/u/timy 宠辱不惊闲看庭前花开花落,去留无意漫观天外云展云舒

博文

自然语言处理领域的算法演化

已有 4149 次阅读 2020-11-9 00:17 |个人分类:自然语言处理|系统分类:论文交流

       在数据驱动型研究论文中,大量算法正被提出、改进或使用。从论文全文内容中识别出算法并进行学术影响力评价,可以确定该领域流行的、经典的乃至新兴的算法,帮助初学者对特定领域算法有较为全面的了解。为此,我们以自然语言处理(NLP)领域为例,对1979~2015年间NLP领域顶级会议ACL全文内容中提及的算法实体进行标注,并构建算法词典;基于算法被提及频次和每年发表文章数,获取不同算法实体的年度学术影响力,进而得到算法实体在NLP领域的总影响力。我们还根据算法所在论文发表时间,分析算法学术影响力随时间演变的不同模式,并指出算法影响力演化反映了该领域研究任务和课题的变化。从演化图(https://chengzhizhang.github.io/research/algorithm_entity/algorithm_influence.html,在线mp4视频:https://chengzhizhang.github.io/research/algorithm_entity/video.html )可以明显看出,在NLP领域,1995年是个重要的时间节点,即机器学习方法逐渐成为主流;SVM从2005年开始独领风骚近十年,直到2015年;2015年开始,以神经网络为基础的深度学习算法成为主流。这项研究目前发表于Journal of Informetrics。


参考文献:

Yuzhuo Wang, Chengzhi Zhang*. Using the Full-text Content of Academic Articles to Identify and Evaluate Algorithm Entities in the Domain of Natural Language Processing. Journal of Informetrics, 2020, 14(2): 101091.[doi] [Demo: Algorithm Influence in NLP (1979~2015)] [Video]



https://blog.sciencenet.cn/blog-36782-1257596.html

上一篇:利用在线评论文本研究大众的食与行
下一篇:CFP: 1st Workshop on AI + Informetrics (AII2021)
收藏 IP: 58.212.99.*| 热度|

1 熊泽泉

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-26 20:01

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部