inforworld分享 http://blog.sciencenet.cn/u/rbwxy197301 教学和科研过程中的心得。

博文

NSTL与国际科学引文数据库(DISC)系统

已有 6374 次阅读 2010-11-7 12:38 |个人分类:信息资源建设|系统分类:科研笔记| NSTL

     《数字图书馆论坛》2010年第10期刊出了一期NSTL(国家科技图书文献中心(National Science and Technology Library)系列论文。从中我们既可以了解到NSTL的发展历程,又可以学习其在发展过程中一系列相关的研究及研究成果。在文献信息资源建设建设过程中,NSTL的发展可以给我们许多启迪。

系列论文名称如下:(注册用户可以从http://www.dlf.net.cn/免费下载)

改革创新 开放联合谱写科技文献共建共享新篇章 
创建NSTL——中国科技文献发展史中重要的一章 
建设国家科技图书文献中心共铸国家科技文献资源共享体系 
从NSTL战略定位到最新进展及未来发展规划 
NSTL文献信息加工10年概述 
NSTL文献资源建设的实践与发展 
NSTL联机联合编目工作的发展与实践 
从系统运维角度看NSTL十年发展历程 
面向信息机构的嵌入式NSTL资源集成服务系统:缘起、功能和特色 
NSTL科技信息服务平台的开放和共享服务 
NSTL网络安全管理系统的设计与实现 
建设国际科学引文数据库拓展NSTL服务内涵 
NSTL服务与区域科技创新 
基于NSTL服务平台的计量原文管理系统建设 
小语种文献数字化对网络文献集成揭示的实践意义 
论冶金专业服务平台之建设 
企业专业化信息服务的实践与思考 
NSTL外文期刊引文数据自动化拆分的研究与实践

在阅读上面相关文章时,意外发现了国家科技图书文献中心开发的国际科学引文数据库(DISC)系统(http://disc.nstl.gov.cn/disc/view/m01/A0100.xhtml)

国际科学引文数据库(Database of International Science Citation, DISC)是国家科技图书文献中心(National Science and Technology Library, NSTL)历时三年投入建设的以科学引证关系为基础的外文文献数据服务系统。系统集成了NSTL外文期刊文献数据库(来自17000多种外文期刊)和优选的理、工、农、医各学科领域的部分优秀西文期刊(来自3,000多种西文期刊)的引文数据,并揭示和计算了文献之间的相关关系和关系强度,为科研人员提供了检索发现世界上重要的科技文献,了解世界科学研究与发展脉络的强大工具。

系统提供文献发现的功能,用户可以从集成的大规模的外文文献数据集合中检索和浏览信息。为帮助用户更好地定位需要的文献,系统提供了检索结果的可视化分析功能,可以通过检索结果分组、关键词云图、论文发表年代分布、被引年代分布、作者合作关系状态、引用强度等可视化分析图形,实时联机分析检索结果,帮助用户在大量的检索集合中根据文献间的相关关系找到自己需要的文献。同时系统也提供引文检索的功能,以发现一篇文献的被引用情况、一个作者的论文影响力、一种期刊、图书、专利等文献的影响力,从而获取在科学研究中产生重要影响的有价值的文献信息。系统与NSTL文献原文传递和代查代借系统无缝链接,支持用户快速获取文献全文。



笔者发现,可以在这个数据免费检索到一些科研工作过程中所需要的相关信息。系统检索分为三个模块:

文献检索,提供对来自NSTL外文期刊篇名数据和参考文献的检索发现,当前记录数为:33,411,824
来源文献检索,提供对来自3000多种引文来源期刊的论文篇名信息的检索发现,当前记录数为:1,426,088
引文检索,提供对来自3000多种引文来源期刊的参考文献信息的检索发现,当前记录数为:48,916,074

如以题名中包括“information retrieval ”,,时间:“2004-2009”(文献检索)。从下图可以查询到相关文献的top5作者、期刊及每年相关文献的信息。另外系统还可以提供年文献量、年被引量及作者关系的可视化分析图;关键词云。

作者关系:指检索结果集合中作者的出现频度和合作强度,目前对前20名作者用图形方式展示出现频度和合作强度,合作强度用两者合作的文献篇数来表示;

关键词云图:指检索结果集合中的关键词数量和重合程度,字体大小表示关键词的出现频度;











数据库中涉及到的其它概念http://disc.nstl.gov.cn/disc/view/m09/A090202.xhtml):

文献数据:指本数据库提供检索的期刊文献数据、参考文献数据的数据集合;
来源数据:指本数据库所选用的引文来源期刊中的文献数据集合;
参考文献:指本文所引用的文献;
引证文献:指引用本文的文献;
相关文献:指与本文在主题或内容上相关的文献;
参考文献相关:指与本文具有共同参考文献的文献;
出版时间:指一篇文献发表的时间;
被引时间:指一篇文献被引用的时间;
分组:从作者、年代和期刊三个维度对检索结果进行过滤和呈现;
同引耦合度:本文与其他文献之间具有共同参考文献的关系为文献耦合,其中共同参考文献的篇数称为同引耦合度;
被引次数:文献发表后被其他文献引用的次数;
年文献量:指检索结果集合中的文献出版年度分布。柱状图高低代表各年文献量,鼠标放置柱状图上可显示该年度文献数量,点击柱状图可获得该年度所有结果记录;
年被引量:指检索结果集合中的文献在各年被引量,用折线图图表显示,鼠标放置折线图上可显示文献在某一年度的被引次数,点击折线图上的数据点可获得该年度引证文献分布;
期刊保存:指保存选中的期刊在“我的期刊列表”里,在用户注册后,可以以选择RSS或邮件推送方式,将定制期刊的最新文献记录推送给用户;
引文推送:是对用户自己定制的文献被引情况的推送服务,方便用户跟踪论文被引用的最新进展;
RSS订阅:用户定制自己感兴趣的内容,当这些内容有变化时,用户可以通过RSS及时获取最新信息;
电子邮件推送:用户通过定制检索条件来预订信息。当数据更新时,用户会收到来自DISC的邮件通知;
专业检索:即布尔逻辑表达式检索。可以通过页面的按钮或链接等来辅助设置组合检索条件表达式,并以此进行检索。

国际科学引文数据库来源期刊遴选方法说明http://disc.nstl.gov.cn/disc/view/m09/A090203.xhtml

国际科学引文数据库项目组以国家科技图书文献中心(NSTL)成员单位订购的印本期刊为基础,采用文献计量学方法,研究并参考国内外引文数据库来源期刊的遴选方法,以学科性、核心性和适用性作为确定国际科学引文数据库(简称DISC)来源期刊的三项基本原则,并广泛征求有关专家的意见后,形成了国际科学引文数据库来源期刊列表。

国际科学引文数据库的服务对象为全国的科研工作者,用户的需求是建立国际科学引文数据库的根本,而期刊的学术声望也是国际科学引文数据库所关注的,国际科学引文数据库希望通过优秀期刊的引文揭示,为用户提供更多发现信息的途径。因此国际科学引文数据库来源期刊的遴选最终以服务于用户为目标。

在研究国内外引文数据库期刊遴选方法后,将国际科学引文数据库的期刊遴选指标定为NSTL外文期刊文摘数据库访问量指标、全文请求量指标、期刊引用指标、摘引指标,其中期刊引用指标数据来自于SCI数据库及中国科学引文数据库(CSCD),摘引指标来自于国际重要的110个二次文摘数据库。指标计算方法如下:

1. 统计2003—2005年度每种期刊在NSTL网络服务系统中的文摘访问量和全文请求量。

2. 对全文请求量进行加权处理。用每种期刊的全文请求量×权值,得出加权后的全文请求量。权值计算方法为:文摘访问总量/全文请求总量。计算结果,权值为22.89。

3. 将每种期刊的文摘访问量和加权后的全文请求量相加,得出每种期刊在03-05三年期间的用户利用分值。将用户利用分值按降序排列,选出前3000种期刊。

4. 将每种期刊的用户利用分值按照降序排列,根据其分值占总分值的百分比累计后,分为5个区段,即:期刊分值占总分值的百分比累计到第一个20%时,该区段的期刊得分为5分;期刊分值占总分值的百分比累计到第二个20%时,该区段的期刊得分4分,依次类推,最后一个20%区段内的期刊得分为1分。

5. 根据SCI、中国科学引文数据库2001—2004年中国科学家引用外文期刊的品种及频次统计,依期刊引用频次降序排列后,累计每种期刊的引用百分比,分为5个区段并赋予5—1分(方法同第4点)。得到每种期刊的用户引用分值。

6. 根据每种期刊被重要二次文摘数据收录的次数计算其分值,赋予每种期刊5—1分。得到摘引指标分值。

7. 为突出用户在使用文献中的行为特征,将用户利用分值给予60%的权重;用户引用分值给予30%的权重;二次文摘引用分值给予10%的权重。即:期刊总分值 = 用户利用分值*60% + 引用分值*30% + 二次文摘分值*10%,最后得到期刊总分值

8. 将期刊总分值降序排列后,通过期刊学科分布情况,做进一步遴选。

经过期刊遴选指标的计算及学科分布情况,目前国际科学引文数据库来源期刊涉及数学、物理、化学、天文学、地理科学、生物学、农业科学、基础医学、药学、预防医学、一般工业技术(含材料学)、无线电与电子技术、计算机科学、金属学、环境科学等学科领域。根据国际科学引文数据库的工作部署,2006-2007年来源期刊为1000余种,2008年至今为3000余种。



https://blog.sciencenet.cn/blog-113146-381246.html

上一篇:“学术期刊论文生产利用的时间分布”
下一篇:中国人口数据统计与简要分析
收藏 IP: .*| 热度|

1 许培扬

发表评论 评论 (1 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 03:52

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部