一直很困惑自己做的工作,为什么要做各种知识组织工具的互操作,国内的文献单位越来越少用规范语言做受控标引了,做KOS的互操作还有什么应用价值。
今天去一个信息服务单位调研,多少受到了一些启发!
(1)国外的互操作为什么那么热。第一,人家重视资源的深加工,四大报告、EI库等等都是基于受控词表来标引的,而且往往应用的受控词表就是针对这个数据库自己的。既然每个资源都有自己的知识组织工具,那么不做互操作,这个资源整合和一站式检索就是空话了!第二,人家KOS资源真是丰富,虽然未必都采用所谓的通用KOS,很多都是服务机构自己根据资源构建的,而且基于文献和标引记录不断维护更新,他们求实。国内KOS的建设往往有个思想禁锢就是要求全,一定要保证全面性,完整性,但实际上那些因为求全而收录的概念或关系,未必有多大作用和实用性,甚至百年难得一用。相信这也是造成国内KOS不友好的一个原因吧!
(2)受控标引到底要不要。全文检索技术的发展太普及了也很实用,即便面对搜索引擎返回的大量无用结果,仍然很多人都没有觉得受控标引有必要,只有图情领域的人在呼吁,不受控资源质量差,检索效率低下?但这种低下其实很多大众用户是能够接受的,跟让他面对晦涩难用的受控检索来说还是要容易得多。但这并不意味着作为文献信息服务机构的单位真的可以完全抛开受控标引,否则为啥四大报告不抛弃,EI数据库不抛弃呢。存在就是合理的!因为,对于专业人员而言,专业资料必须是高质量高服务的,这里面的检索容不下那么多无关结果。所以说受控标引要,但要看用在什么单位,什么资源上,还有就是怎么做的问题。
(3)自动化的问题。现在动辄就是自动构建,自动分类,自动标引等等,但这些KOS构建、信息内容深加工本身就是一个智力密集型工作,真的要抛开人的智能吗?个人觉得在这个过程中还是要分清人的智能和机器智能所处的位置,合理分工很重要!
(4)实用化问题。目前的技术不可谓不先进,思想也不可谓不新潮,但是为什么总是落不到实用上,研究与应用之间总是存在一定距离的。技术怎么为应用服务!
不成熟的想法,未完!
https://blog.sciencenet.cn/blog-110726-251359.html
上一篇:
i-school下一篇:
听罗凤珠教授“根植于诗词文学特性的诗词语言处理及研究之应用”有感