化柏林分享 http://blog.sciencenet.cn/u/huabolin

博文

数据为基的情报学——《情报学报》2012年第6期卷首语

已有 4595 次阅读 2012-7-3 07:25 |个人分类:情报探讨|系统分类:观点评述| 情报学, 数据

化柏林 武夷山

1.情报学以数据为基础

随着社会信息化发展的进程,科学研究的主导范式已由实验驱动的研究范式、逻辑驱动的研究范式、模拟驱动的研究范式转为数据驱动的研究范式。作为数据驱动的典型学科,情报学对数据的依赖尤为明显。从布拉德福定律到核心期刊的遴选,从科学引文索引到H指数,从Dialog数据到多源异构数据,从论文统计数据到专利分析数据,从德尔斐调查到网络日志挖掘,从定标比超到循证决策,情报学的研究从来没有离开过数据。正是因为有了数据,情报学研究才会脚踏实地;正是因为有了数据,情报服务的支撑作用才会坚实有力。情报学研究中如果没有数据,就如同生物学研究中没有标本,化学研究中没有试剂一样,成了无“基”之谈。

2.用数据说话的情报工作

数据在现代科技决策中的作用越来越突显。国务院于200629日发布的《国家中长期科技发展规划纲要(20062020)》对未来的科技发展应达到的情况进行了预测与规划,“到2020年,全社会研究开发投入占国内生产总值的比重提高到2.5%以上,力争科技进步贡献率达到60%以上,对外技术依存度降低到30%以下,本国人发明专利年度授权量和国际科学论文被引用数均进入世界前5位”。每一个方面的描述都有具体的数字,而每个数字背后都需要强有力的数据支撑,在这些丰富的数据基础上进行一系列的测算分析。如何快速地获取准确数据、高效地分析海量数据、清晰地解读系列数据是情报工作者面临的严峻挑战。

3.情报领域涉及的数据类型

当然,数据不仅仅是数值型数据,还包括文本型数据、图形图像数据、音频视频数据等。按照结构化程度又可把数据分为结构化数据、半结构化数据与非结构化数据。数据按照产生的方式分为自然数据与人工数据。自然数据是指人类在认识世界与改造世界过程中自然而然形成的数据,这些数据受到人工干预的程度较低,如科研论文、电子病例、网络日志等;人工数据是在研究社会现象的过程中为了实现某种研究目的、经由较多的人工干预所产生的数据,如调查问卷的数据、专题访谈的数据等。不同类型的数据在情报领域中发挥着不同的作用,不同的发展阶段对数据的要求也不一致。但是综合利用多来源、多形式的数据是现代情报工作的鲜明特点。

4.《情报学报》论文中的数据

《情报学报》的文章大都有着丰富的数据,这些数据包括实践数据与实验数据两大类。本期有8篇论文包含实践数据,有4篇论文含有实验数据。实践数据是指在情报工作实践中采集的数据,如科技论文数据、专利数据、网络日志等。实验数据为验证理论模型的合理性或理论方法的有效性而专门构建的数据集。需要指出的是,目前情报论文里用来验证的数据,大都是计算机领域的测试数据,缺乏针对情报领域问题的通用测试数据,这个问题需要关注。

5数据为王的情报学

在“数据为王”的年代里,没有数据支撑的情报研究将会变得弱不禁风,没有数据支撑的研究论文也经常是乏善可陈的论文。只有打牢数据基础,并在此基础上进行专业的精密分析,情报学的学科地位才会稳如磐石,情报学研究人员就有可能在海量数据或者“大数据”时代里成为身手矫健、令人艳羡的弄潮儿!

 

 

化柏林武夷山_数据为基的情报学.pdf

 

 



https://blog.sciencenet.cn/blog-91591-588369.html

上一篇:《情报学报》2012年第6期题录文摘信息
下一篇:《情报学报》2012年第7期题录文摘信息
收藏 IP: 168.160.62.*| 热度|

15 许培扬 王娟娟 章成志 刘桂锋 刘耀 杜建 朱云霞 王鹏 王芳 魏瑞斌 赵星 陈凯华 周雄伟 王晓光 胡泽文

该博文允许注册用户评论 请点击登录 评论 (15 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-16 12:05

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部