||
Stegmann and Grohmann
Stegmann and Grohmann通过运用共词技术拓展了SL方法,这是一种用于聚类的统计学方法。他们不使用单词或者概念,而是分析文献集合中每对MEDLINE文献的关键词共同出现次数。关键词包括MeSH以及酶标记号和CAS注册号。这些分析最后生成了所包含关键词的地图或者“战略坐标”。链接互补又分离文献的promising(有希望的)词倾向于出现在低向心度和密度的区域。通过复制Swanson在雷诺氏病和鱼油关系、偏头痛和酶缺乏上面的发现,验证了他们的方法的有效性,他们还发现朊病毒、神经变性疾病和锰之间的关系。这种关系早期曾经由Chen在研究知识潜在领域问题的时候提出过。之所以叫潜在,是因为在陈的关于知识地图的书中这是些被引频次低的重要论文。
共词分析和聚类的优点在于研究初期选词是自动化的。但是,专题的专家还是要为了最后选择合适的词而评判一下各个类别。共词聚类的另外一个优点是用户对类别的地图或者坐标评价起来要比评价一长串排序的词要容易得多。其缺点是这种方法依赖于来自于受控词表的关键词。其他挖掘标题和文摘的方法更适合没有关键词的方法。此外,这种考量在将来研究人员需要合并没有统一主题词表的数据库并在其中挖掘信息的时候会显得十分重要。
Gordon MD, Lindsay RK. Toward discovery support systems: a replication, re-examination, and extension of Swanson's work on literature-based discovery of a connection between Raynaud's and fish oil. Journal of the American Society for Information Science. 1996;47:116–128
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-1-5 14:13
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社