许培扬博客分享 http://blog.sciencenet.cn/u/xupeiyang 跟踪国际前沿 服务国内科研

博文

许培扬文集 计算机辅助标引技术研究 1996年发表

已有 1960 次阅读 2014-12-15 11:26 |个人分类:我的日记|系统分类:科研笔记

       1987-1995年,我们组织20个图书情报机构50多名标引员进行医学数据库的文献分类和主题标引,每年只能深度标引5万篇文献,而当时每年的医学文献达10万篇,标引工作跟不上,严重影响数据库建设进度和检索使用。在我们图书馆编目林美兰教授主编的《医学分类主题对应表》的基础上,进行计算机辅助文献标引的研究。林教授又在所里申请到5万经费,组织编制出版了《中国图书馆分类法----医学专业分类表》,林美兰主编 许培扬  金晶副主编。

        我们提出了计算机辅助分类主题一体化标引技术,计算机室胡铁军、李丹亚等一起研发计算机辅助标引词表,将文献的关键词与主题词对应,主题词与分类号对应,没有自动转换标引技术,标引结果由标引员进行人工审核,大大提高了文献标引效率。

        我在国家图书馆召开的全国分类法与主题法发展研讨会上介绍了我们的光盘数据库文献标引技术方法,得到大家的好评。我当时就请教了情报语言专家张琪玉教授,我文张老师:我们的词表对应方法是否可行,会不会有什么大问题?他回答说,应该大胆尝试,不会有什么大问题。2003年,中国知网(CNKI)医院知识仓库(CHKD)技术研讨会上,张群山经理问我CHKD能否采用主题标引技术?我说可以,从此CHKD也采用了我们这套标引技术方法。现在看来,这个技术方法很好,医学数据库的标引质量和检索效果都很好。

         1996年,我们研究所研制的中国生物医学文献光盘数据库检索系统(CBM)荣获国家优秀情报成果三等奖,由科技部、国防科工委、中科院、中国科协颁发奖励证书。我是主要研发成员之一。

          我从1987年得到医科院10000元青年科研基金的资助,研究文献标引技术方法,到1996年取得了一点研究成果,在CBM数据库和CHKD数据库中应用。

 

中国生物医学文献光盘数据库检索系统——文献处理的原则与方法

【作者】 许培扬李丹亚胡铁军韩剑锋宋镇钟诸文雁钱庆

【机构】 中国医学科学院中国协和医科大学医学信息研究所中国医学科学院中国协和医科大学医学信息研究所

【摘要】 传统的标引方法工作效率低、费用高,标引的深度浅,一致性低,不能适应计算机文献检索系统的文献前处理高效、量大、快速的要求。本文探讨建立新型文献处理技术的方法,即对照标引系统,包括关键词与主题词的对应与转换,主题词与分类号的对应与转换等。确定了抽取关键词的原则与方法,主题词一分类号对应的原则与方法。所述方法的文献处理工作程序人机结合,人工抽取关键词,建立对应表,由计算机自动转换成主题词和分类号,处理速度快,标引深度增加,一致性得到保证。本系统实现了自然语言与受控语言相结合,分类主题一体化。是一个集成、高效、规范化的文献处理系统。



https://blog.sciencenet.cn/blog-280034-851188.html

上一篇:许培扬文集 知识组织研究 1994年发表
下一篇:许培扬文集 数据库标引技术研究 1996年发表
收藏 IP: 114.111.167.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-28 12:36

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部