||
做菜与科学计量学研究
武夷山
(《情报学报》2013年第10期卷首语)
巧妇难为无米之炊,科学计量学工作者最怕没有数据可供分析。
数据从哪里来?主要靠自己去搜集、挖掘。对于多数从事自然科学研究的,如果不愿意、不屑于好好做实验,那就趁早离开得了。同理,对于从事科学计量学研究的,如果不肯花力气去搜集、挖掘待分析的数据,那就趁早改行得了。搜集、挖掘数据的活,好比是种菜、买菜、择菜、洗菜、切菜,数据分析的活,好比是大师傅颠勺儿。显然,后者更能显示技术含量,于是更有吸引力。但是,有几个烹调大师是专门掌勺、不会切菜的?不从基本功做起、练起,很难最终成为大师。
1991年,我在《情报学刊》(已停刊)上发表了题为《两种科技译文期刊的文献计量学比较研究》,这也许是迄今唯一一篇以译文期刊为研究对象的论文。我选择了《世界科学》和《国外科技动态》这两种科技译文刊物为样本,从译者群体、学科取向(译文刊物编辑部在选择源文献时是更偏向科学文献还是偏向技术文献)、源出版物的分布、发表时滞(从原文发表到译文问世所经历的时间)等四方面进行了分析比较。当时,没有任何期刊数据库可供利用,只能用人工方式获取数据。获取数据的过程是很辛苦的,但也是有报偿的,报偿就是成为将译文期刊作为文献计量学研究对象的第一人,好比南京马祥兴菜馆创出了招牌菜“美人肝”。这道菜名为“美人肝”,其实不是“肝”,而是用鸭子的胰脏为原料烹制的。鸭子的胰脏与鸭肠相连,长约六厘米,又称胰白。一般清真菜馆以鸡鸭类家禽为食材时,主要制作成烧鸡、烤鸭、炖鸭、鸭脯、鸭舌、鸭掌等,马祥兴的厨师却别出心裁把通常无人问津的胰脏做成菜,出奇制胜。
亲手获取第一手数据是费时费力的,因此,一些具备分析技能但实在没有时间或不屑于自己收集原始数据的研究人员,往往喜欢利用现成的数据。对于他们,各种统计年鉴就成了宝贝。利用现成数据,本身是无可厚非的,但一般来说,我们是先确定了研究问题,再决定何种变量有助于回答这个问题,而不是先确定要利用什么数据,然后看看这些数据可以回答什么问题。后一种情形,容易削足适履。比如,有人利用科技统计年鉴上提供的论文数、专利数、研发人员数、研发经费数做文章,研究各省区的创新能力与另一些变量的相关性。可是,有些人用专利申请数作为创新能力的替代指标,就不太合适了。专利申请数好比论文投稿数,专利授权数才类似于论文发表数。申请量大,表明广大企业、个人的发明积极性高涨,保护知识产权的意识强,但未必表明其创新能力强。这样的研究,搞不好成了笑柄。
要利用现成数据做文章,一定要把问题想透,这些现成数据能说明哪些过去未被关注的问题?2012年8月5日,大连理工大学王贤文等在Journalof Informetrics杂志发表文章,他们利用施普林格出版集团的realtime.springer.com实时监测平台,巧妙地获取其稍纵即逝的数据,分析了几个不同国家的科研人员下载论文的时间分布,可以看出,各国科研人员在周末加班的都很多。这就是利用现成数据做出漂亮文章的一个很好的例子。这就好比,有人只会做烧萝卜、炒萝卜、拌萝卜,有人却能将萝卜雕刻成艺术品。
无论是亲自准备食材还是利用比较现成的食材,都需要烹调大师的匠心独运;无论是亲自搜集数据还是利用现成的数据,都需要科学计量学工作者头脑清楚,心如明镜。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-21 18:36
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社