章成志 分享 http://blog.sciencenet.cn/u/timy 宠辱不惊闲看庭前花开花落,去留无意漫观天外云展云舒

博文

利用图书评论数据来评价图书的影响力

已有 10246 次阅读 2016-3-29 09:29 |个人分类:同行交流|系统分类:论文交流| 评论挖掘, 图书评价, 图书影响力

      随着学术专著(或图书)的数量不断增加,评价图书的影响力问题日益重要,评价的结果可用于学术图书的推荐,例如,在某一领域,从众多的学术图书中挑选出有影响力的图书,推荐给要进入该领域的初学者。
      与传统的论文或期刊评价不同的是,学术图书的被引信息相对较少(在自然科学领域,学术图书被引信息更少),完全从被引角度来评价学术图书影响力存在一定的难度。另外关于图书的专业书评信息也较少,有些图书是有了一定影响力之后才出现书评。因此,从可依据的资源来看,评价学术图书的影响力比传统的论文或期刊评价难度要高。
      当前,已有研究者利用Google Books、图书馆藏量、出版社声誉等信息来对图书进行替代式的评价(Altmetrics),然而这些方法还过于宏观、没有从内容层面来对图书影响力进行评价,并且无法判断影响力背后的实际原因。
      为此,我们利用网络上(特别是电商网站上)关于学术图书的丰富的评论文本,进行文档与属性层面的评论挖掘,来考察学术图书的影响力。在试验中,我们以中文学术图书为例,具体做法为:

      首先,以“中国人文社会科学图书学术影响力报告”(2011年出版)中的学术图书为基础,我们选择经济学、管理学、图书情报、心理学以及文学等5个学科领域的图书作为实验对象。将以上5个学科领域的图书在亚马逊中文站点上的图书评论采集下来。  
      然后,我们利用评论挖掘技术(主要为多粒度情感分类,包括段落级情感分类、属性识别与属性情感极性分类等方法)对图书评论进行多粒度的挖掘。

      接着,我们利用图书的正面评论数、负面评论数、属性情感值、图书评论星级(1~5)、评论有用性信息(0~1),通过熵权方法进行融合,得到图书的综合分值。

      最后,对图书影响力分值与传统图书被引频次进行相关性分析。

      相关性分析结果表明:虽然不同学科领域有明显差异,但是在线图书评论确实能够反映图书的学术影响力。因此,我们认为从替代计量角度来看,在线评论可以作为挖掘图书多粒度、内容层面影响力的有效资源。此外,我们提出的方法也可用于评价学术出版物之外的其他图书的影响力。

      我们的具体工作可以参加如下论文:

      Qingqing Zhou, Chengzhi Zhang*, Star X. Zhao, Bikun Chen.
Measuring book impact based on the multi-granularity
online review mining
.  Scientometrics. 2016. http://dx.doi.org/10.1007/s11192-016-1930-5


      感谢赵星、陈必坤老师在论文修改过程中给予的有价值的建议。







https://blog.sciencenet.cn/blog-36782-965702.html

上一篇:中美网民购物行为有何差异? 用电商网站产品评论来回答
下一篇:CFP: TEL Special Issue on Managing Bigger Online Data
收藏 IP: 219.230.100.*| 热度|

8 赵星 陈果 赵宇翔 王启云 俞立平 姜春林 林耕 王兴

该博文允许注册用户评论 请点击登录 评论 (4 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 13:42

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部