信息检索与信息抽取差异性探析
已有 5541 次阅读
2008-10-27 10:29
|个人分类:信息检索|
信息抽取, 信息检索, 命名实体识别, 模式匹配, 规则抽取
信息检索与信息抽取差异性探析
郑彦宁,化柏林,张新民
中国科学技术信息研究所 北京 100038
(发表于《图书情报工作》2007年第10期)
通过发表论文、会议组织、出入口、关键技术、发展趋势等方面对信息检索与信息抽取进行比较分析,结果发现信息抽取与信息检索有着质的不同。信息抽取不是信息检索的发展方向,但信息抽取技术可以很好地应用于信息检索系统。分析两者之间的差异有利于研究的深入,理清它们的关系有利于共同促进。
*******************************************
论点一:信息检索强调对检索入口进行控制,并不对检索出口进行控制
信息检索策略的调整只能决定检索结果的多与少,并不能决定每条检索结果的大与小。查到了相应的文献,而在文档中有许多不需要的信息,通过信息抽取把需要的信息单元抽取出来,过滤掉其它信息。
*************************************
论点二:信息检索的粒度要比信息抽取的粒度大
信息检索以篇为单位,信息抽取以篇中的信息单元为处理单位。信息检索一般返回整篇文献,而信息抽取是返回信息的某个单元。
*************************************
论点三:信息检索的最终用户是人,而信息抽取的用户是计算机。
信息检索由人构造检索式,通过系统进行检索,得到检索结果由人来查看,整个过程中体现着人机交互。而信息抽取一般是系统根据模板和预先设定的规则,通过分析文本抽取需要的内容,信息抽取系统一般不单独使用,往往是为其它系统提供技术工具,信息抽取过程往往不需要人机交互。
*************************************
信息检索与信息抽取差异性探析
https://blog.sciencenet.cn/blog-91591-44273.html
上一篇:
08年总结:雪震双灾,奥赛钱危话世界。下一篇:
数据挖掘与知识发现关系探析