化柏林分享 http://blog.sciencenet.cn/u/huabolin

博文

从检索技术的实现看三大全文数据库的发展

已有 4492 次阅读 2008-10-24 12:31 |个人分类:信息检索|系统分类:观点评述| 全文检索, 全文数据库, 检索技术, 清华同方, 万方数据

(发表于《图书情报工作》2007年第10期)
 
【摘要】  通过三个有针对性的检索对清华同方、万方数据、重庆维普三大全文数据库的检索技术实现的特点进行分析,从其目前提供的功能和招聘信息分析他们在竞争中所处的位置。指出全文数据库的三大核心竞争力是:历史数据的回溯、当前的数据质量、未来的增值服务。进而对未来的增值服务进行分析与预测,包括计量分析自动生成系统、句子级文献自动审稿系统、参考文献自动标注系统、观点型搜索,这些系统的实现将使得文献服务真正走向知识服务。
****************************************************************************
论点一:检索词长了,检索结果未必少 
标题精确检索图书馆比图书的结果多
网络信息计量学的检索结果也比网络信息计量的检索结果多
元数据的检索结果比数据的结果少
****************************************************************************
论点二:核心竞争力
期刊全文数据库的竞争主要体现在三个方面:
历史数据的回溯;
当前的数据质量;
未来的增值服务,即数据的深加工程度。
*****************************************************************************
论点三:增值服务是核心竞争力的核心
增值服务除了提供更好的检索服务外(如中英文摘要语料对齐后的双语检索),还包括(但不仅限于)以下的应用:
(1)提供文献计量自动分析的查询,如清华同方已推出的“中国学术期刊文献评价统计分析系统”。
(2)提供学术调研报告的自动生成,在文献计量自动分析的基础上,对国内外某领域进展情况进行评述。学术调研评价可以指导论文的选题和前期调研,特别有利于论文选题、项目评审等工作。
(3)可以从句子级提供文献自动审稿辅助功能,以及参考文献自动标注功能。
(4)提供更小粒度的检索,支持句子检索、真正的图片检索(首先是流程图、系统结构图、数据表等的检索,以后会支持图像检索,从颜色、纹理、形状等各个要素进行分析),大量使用信息抽取技术,提供列表式搜索。
(5)支持学术问答,支持观点型搜索、流派型搜索,能够提供学者谱系图,利用学位论文的致谢提供导师自动评价系统。
(6)提供知识点与知识点之间的链接,实现真正的知识服务。正如由过去买本整刊进行阅读到现在只看某篇文章,将来可能实现只看某篇文章的某一部分。

****************************************************************************
从检索技术的实现看三大全文数据库的发展

https://blog.sciencenet.cn/blog-91591-43857.html

上一篇:从IPO分析未来的搜索引擎
下一篇:知识抽取中的停用词处理技术
收藏 IP: .*| 热度|

0

发表评论 评论 (1 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 15:22

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部