博文

自然语言处理领域的算法演化

已有 4149 次阅读 2020-11-9 00:17 |个人分类:自然语言处理|系统分类:论文交流

在数据驱动型研究论文中，大量算法正被提出、改进或使用。从论文全文内容中识别出算法并进行学术影响力评价，可以确定该领域流行的、经典的乃至新兴的算法，帮助初学者对特定领域算法有较为全面的了解。为此，我们以自然语言处理（NLP）领域为例，对1979~2015年间NLP领域顶级会议ACL全文内容中提及的算法实体进行标注，并构建算法词典；基于算法被提及频次和每年发表文章数，获取不同算法实体的年度学术影响力，进而得到算法实体在NLP领域的总影响力。我们还根据算法所在论文发表时间，分析算法学术影响力随时间演变的不同模式，并指出算法影响力演化反映了该领域研究任务和课题的变化。从演化图（https://chengzhizhang.github.io/research/algorithm_entity/algorithm_influence.html，在线mp4视频：https://chengzhizhang.github.io/research/algorithm_entity/video.html ）可以明显看出，在NLP领域，1995年是个重要的时间节点，即机器学习方法逐渐成为主流；SVM从2005年开始独领风骚近十年，直到2015年；2015年开始，以神经网络为基础的深度学习算法成为主流。这项研究目前发表于Journal of Informetrics。

参考文献：

Yuzhuo Wang, Chengzhi Zhang*. Using the Full-text Content of Academic Articles to Identify and Evaluate Algorithm Entities in the Domain of Natural Language Processing. Journal of Informetrics, 2020, 14(2): 101091.[doi] [Demo: Algorithm Influence in NLP (1979~2015)] [Video]

转载本文请联系原作者获取授权，同时请注明本文来自章成志科学网博客。
链接地址：https://blog.sciencenet.cn/blog-36782-1257596.html

上一篇：利用在线评论文本研究大众的食与行
下一篇：CFP: 1st Workshop on AI + Informetrics (AII2021)

收藏 IP: 58.212.99.*| 热度|

当前推荐数：1 推荐人：熊泽泉

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

章成志

扫一扫，分享此博文

章成志　分享 http://blog.sciencenet.cn/u/timy 宠辱不惊闲看庭前花开花落，去留无意漫观天外云展云舒

博文

自然语言处理领域的算法演化

当前推荐数：1 推荐人：熊泽泉

该博文允许注册用户评论请点击登录评论 (0 个评论)

章成志

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

章成志 分享 http://blog.sciencenet.cn/u/timy 宠辱不惊闲看庭前花开花落，去留无意漫观天外云展云舒

博文

自然语言处理领域的算法演化

当前推荐数：1 推荐人： 熊泽泉

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

章成志

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

章成志　分享 http://blog.sciencenet.cn/u/timy 宠辱不惊闲看庭前花开花落，去留无意漫观天外云展云舒

当前推荐数：1 推荐人：熊泽泉

该博文允许注册用户评论请点击登录评论 (0 个评论)