崔雷的窗口分享 http://blog.sciencenet.cn/u/zilu85 我在专业领域里的感受

博文

利用本体为基础的文本挖掘方法从MEDLINE文摘中抽取生物学关系抽取并应答查询

已有 4804 次阅读 2008-10-14 02:14 |个人分类:生物医学文本挖掘| 文本挖掘, 本体, 概念抽取, 共现, 生物学关系

生物学文本数据存储量的急剧增长使得造成了人类方便有效地获取所需信息上的困难。问题的出现是由于大多数信息都隐含在无结构或者半结构的文本中,这些文本计算机无法轻易地理解。

本文介绍了一个基于本体的生物学信息抽取与查询应答系统(Biological Information Extraction and Query AnsweringBIEQA),该系统首先通过对一组存储在生物学本体中的概念进行文本挖掘,然后应用自然语言处理技术和共现分析技术挖掘出概念间可能的生物学关系。系统用文本挖掘方法将每一对生物学概念间频繁出现的生物学关系抽取出来。挖掘出来的关系都标有成员隶属程度的模糊值,该值等于该关系出现频次占整个文献集合中关系频次的比例,称作模糊生物学关系。把从文本集合中抽取出来的模糊生物学关系与其他诸如关系中出现的生物学条目等相关信息存储于数据库中。

数据库与问询处理模型集成在一起。查询处理模型带有界面,指导用户生成不同精确度的正规检索策略。

 

Biological relation extraction and query answering from MEDLINE abstracts using ontology-based text mining

Muhammad Abulaish and Lipika Dey

Data & Knowledge Engineering
Volume 61, Issue 2, May 2007, Pages 228-262



https://blog.sciencenet.cn/blog-82196-42574.html

上一篇:MetaMap程序是如何把生物医学文本有效地匹配到一体化医学语言系统的超级词表的
下一篇:基于文献的发现实例[译文]
收藏 IP: .*| 热度|

1 liupengnian

发表评论 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-26 23:52

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部