武夷山分享 http://blog.sciencenet.cn/u/Wuyishan 中国科学技术发展战略研究院研究员;南京大学信息管理系博导

博文

大数据时代的科学计量学新方向(受托发表) 精选

已有 3206 次阅读 2017-3-18 07:32 |个人分类:科学计量学研究|系统分类:观点评述

 

http://product.dangdang.com/24156218.html

大数据时代的科学计量学新方向

——王贤文著《科学计量大数据及其应用》一书序

刘则渊

 

科学家的一天,似乎与常人不同,但既非不食人间烟火,也无什么惊人之举。后者,迄今科学史上仅有一例,186931日这一天俄罗斯化学家门捷列夫(Д.И.Менделе́ев,18341907)发现了化学元素周期律,史称“伟大发现的一天”。业经手稿、档案的严密考证,确认了门捷列夫一天内编制出完整的元素周期表,同时又查明之前他在写作《化学原理》的过程中对元素分类进行了坚持不懈的探索和尝试[1]。平时积累,成就一天。正如科学计量学之父普赖斯(Derek John de Solla Price, 19221983)的一句名言所说:“科学如今清楚地表明,巨大进步集成于各种方式的小步之中。”[2]当然,一项巨大进步未必集中在一天。

普赖斯的这句名言再次为最近的一项研究结果所印证。该项研究通过实时追踪世界各地科学家借助互联网每天从数字文档数据库中下载科学论文的大数据分析,获得每天024小时论文下载量波动的周期曲线,证实了科学家群体的每一天确非平常,平时熬夜、周末加班系工作常态。这项研究以《探索科学家的工作时间表》为题的英文论文[3]公开发表后,引起强烈反响,国内外媒体纷纷加以转发、报道或评论。

现在,作者王贤文博士在《科学计量大数据及其应用》这部专著中,披露了那篇论文的机缘、由来与传播盛况。这项有趣的研究,不独直观地展现出科学家们夜以继日,探赜索隐的不倦努力,并暗示出科研成果源于“积小步,成大步”所铸就,而且初露出当今数字化、互联网、大数据时代的科学计量学新方向。

正是取代纸质出版物的数字文档,才使得科学论文可以不断下载而不会像纸质论文不断消耗,我们也才有了计量和分析的新对象;正是有了遍及全球的互联网,才使得宏大的数字文档数据库,吸引遍布世界各地的科学家前来搜索、浏览和下载所需的论著,我们也才有了监测和追踪科学家网上活动的有效手段;显而易见,仅仅监测和纪录论文下载的少量数据,不足以显现科学家下载论文的世界空间分布特征与时间分布周期规律;因此,这是一项需要大数据且能够产生大数据的计量研究。

在这本著作中,作者敏锐地把握住当今信息时代数字化、互联网、大数据三大技术特征,着眼于当代科学活动及科学文本的大数据引领科学计量学深刻变革的理念,将全书分为两大部分。第一部分为科学计量的大数据基础,分四章先后论述了数字出版、互联网与科学文献大数据,面向科学计量的数据体系,科学论文的使用数据和论文使用数据的开放获取优势;第二部分为论文大数据在科学计量中的应用,分四章分别探讨科学家的工作时间表,科学论文在社交网络中的传播机制,实时追索论文使用数据呈现的研究热点与研究前沿,以及基于使用、引用等多重指标数据的单篇论文评价体系。

该书令人耳目一新,不仅在于汇集了作者近五年来在科学计量学新方法一系列创造性的研究成果,而且还在于从这些成果中提炼出清晰的科学计量大数据思路与分析框架。众所周知,数据的完整性、可靠性与可获得性,是科学计量学方法应用中取得可靠性成果的基础与前提。过去常说科学计量学面对的是科学文献的海量数据,随着科研活动的不断拓宽和科研产出的急剧增长,数据规模亦迅速扩大,如今以“大数据”概念描述数据的大规模特征。因此,数据的挖掘、整理、清洗等一系列的处理方法,并构建有关科学活动的大数据获取利用平台,就成为科学计量学新方法的关键。当初贤文把他带领研究生监测世界各地网上下载论文的研究工作告诉我时,我立即意识到这是一个科学计量的大数据思路,应当作为新领域新方向新方法坚持下去,不断探索。这项研究成果发表后,我将贤文的开创性工作定为“基于大数据网络监测的科学活动计量分析”新领域系列研究成果,作为我们WISE实验室的两项重要成果之一,被大连理工大学人文学部列入985工程三期总结报告中的标志性成果,并上报纳入大连理工大学985工程三期总结报告中。如今,科学计量大数据思维方式已构成这本书的基础与主线。

自从贤文入学以来,特别是近年来,我目睹了贤文的迅速成长。作为他攻读博士学位的指导教师,我为他的每项成果、每个进步而高兴,而自豪。这些年我常讲:在科学学领域,中青年学者都是向前看,迈向无尽的前沿,而我总是向后看,希望温故而知新。贤文是青年学者中的佼佼者,可谓青出于蓝而胜于蓝。他总是实时把他的每项研究、新的思路告诉我,令我惊讶,兴奋不已。而我往后看,倡导“回到贝尔纳!”“回到普赖斯!”总是把从我们学科两位先驱者的经典著作中的“新发现”,告诉贤文等年轻人,同他们议论讨论,总能得到响应。这次在浏览、阅读贤文的这本书稿中,我发现了这种回应:

例如,贝尔纳曾预言:“科学自身的迅速发展,使得科学杂志在实际上行将淘汰。”[4]这本书的回应:“学术出版数字化的浪涛,不断拍击着期刊这一人为设置的脆弱壁垒,科学论文逐渐从期刊的桎梏中被解放出来。目前,虽然名义上科学论文仍旧以期刊为载体进行出版发行,但实际上,人们检索论文、获取论文、评价论文等一系列行为所指向的目标,已经回归到科学论文本身。”一场废弃科学期刊、实现科学论文直接交流的革命正悄然而来。

又如,普赖斯曾指出,“我相信,正是研究前沿将科学从其他学问中区分出来”[5]。这意味着科学计量学任何一种新方法,都必须将探测科学研究前沿作为自己的首要的核心使命,否则自身将被区分为非科学。这本著作对此做出了精彩的回应:用一个模型、一个案例,从一个领域的大数据中提取出该领域研究的热点、前沿和趋势。

再如,引文作为科学交流的痕迹,是科学文本的组成部分及与非科学的重要区别。这一现象后来被加菲尔德(Eugene Garfield)发现而发明了科学引文索引(SCI),进而他和普赖斯又据此开创了科学引文分析和引文网络分析的方法。近年来却受到诸多质疑,甚至出现试图以“Altmetrics(补充计量学)”取代引文分析的倾向。针对这种状况,我在多种场合强调引文分析作为科学文献的内生方法,引文作为科学评价的内生或外生指标,具有不可替代性。这也曾和贤文做过交流和讨论。国内外一些学者对Altmetrics也有种种质疑和争议[6]。这本书对此做出了积极的回应:尽管应用了补充计量学指标,“还是倾向于将使用数据和补充计量学进行区分”;而且在单篇论文的评价指标体系中将引用指标和社交媒体指标、使用数据指标和网络采集指标结合起来。

然而,这些都是外生指标,作者已经注意到这点。在今后的探索中,还可以依据“论文完成时其本身的质量决定本身水平与外在影响”的观点,进一步在单篇论文评价中把基于论文自身状况的内生指标与论文外在影响的外生指标结合起来;特别是在全文本引文数据库兴起,并产生新的全文论文大数据的条件下,单篇论文评价的内生指标,还可根据全文空间结构信息和全文引文空间信息来加以细化和分解。这必将使科学评价走上更为公正合理的轨道。

总之,在我看来,《科学计量大数据及其应用》一书,在我国开启了大数据时代的科学计量学新方向。如今它与正在兴起的全文引文分析领域,比邻而居,争相媲美。我想,如果科学计量学领域这两股新军交叉结合起来,必将形成交相辉映,相得益彰,多元而又统一的新局面。

这是我对未来科学计量学发展图景的展望,更是对在这个领域开拓前行的作者王贤文博士的莫大期待。

20161031日于大连新新园)

 

参考文献及注释

[1]参见:俄罗斯科学史家、哲学家和科学学家凯德洛夫(Б.М. Кедров1903-1985)《伟大发现的一天》(1958年第1),及其2001年第2版特约编辑特里弗诺夫(Д.Н.Трифонов)编后记Кедров Б. М. День одного великого открытия. Об открытии Д.И. Менделеевым периодического закона. — 2001. — (Философы России ХХ века). — ISBN 5-8360-0058-1.

[2]Price DJD. “Research on Research”. in Journeys in Science: Small Steps - Great Strides, ed. David L. Arm. The University of New Mexico Press, 1967: 1-21.

[3]Wang, X., et al.Exploring Scientists’ Working Timetable: Do Scientists Often Work Overtime? Journal of Informetrics,2012, 6(4): 655-660.

[4] J. D.贝尔纳.二十五年以后1964.M.戈德史密斯,A.I.马凯主编.科学的科学赵红州,蒋国华译.北京:科学出版社,1985245-267.

[5] D.普赖斯.科学论文的网络1965.张崴译,梁立明校载刘则渊,王续琨主编.科学• 技术发展——中国科学学与与科技管理研究年鉴2008/2009 年卷.张崴译,梁立明校.大连:大连理工大学出版社,2010:29-39.

[6] 翟自洋科学网博客.由信息计量学新词altmetrics的翻译想到的http://blog.sciencenet.cn/blog-630081-679433.html. 发表2013-4-12/引用2016-10-30.博文中介绍著名科学计量学家鲁索(Ronald Rousseau)学术报告,鲁索不赞成这个提法,提出用Influmetrics术语取代;而武夷山建议译为补充型指标计量学,博文将Influmetrics译为社媒影响计量学。引者注:altmetrics一词不知何时被译为替代计量学,因此,参考武夷山的建议,这里将altmetrics直接译为补充计量学,或者改用Suppmetrics (“补充计量学”, Supplementary metrics)的术语。

 

 


 作者简介:刘则渊,大连理工大学科学学与科技管理研究所教授、博士生导师。

王贤文的《科学计量大数据及其应用》一书,已由科学出版社2016年出版。

 



http://blog.sciencenet.cn/blog-1557-1040129.html

上一篇:关于美国总统的有趣事实与花絮(二)
下一篇:关于美国总统的有趣事实与花絮(三)

18 许培扬 蒋迅 史晓雷 强涛 胡志刚 王贤文 张立伟 陆泽橼 魏瑞斌 赵星 章成志 孙颉 俞立平 赵庆华 xlsd ychengwei aliala qzw

该博文允许注册用户评论 请点击登录 评论 (9 个评论)

数据加载中...

Archiver|科学网 ( 京ICP备14006957 )

GMT+8, 2017-8-21 01:32

Powered by ScienceNet.cn

Copyright © 2007-2017 中国科学报社