崔雷的窗口分享 http://blog.sciencenet.cn/u/zilu85 我在专业领域里的感受

博文

通过web的生物医学文本处理工具:Whatizit

已有 4966 次阅读 2016-7-20 13:24 |个人分类:生物信息学|系统分类:科研笔记| 生物信息学, whatizit, 抽取术语

动机:文本挖掘方法已经进入到为生物医学研究者提供有效服务的阶段。这些方法需要解决的首要问题是资源(比如受控词表,要处理的文献(比如在PubMed中已经有一千七百万的文献),以及用户的需求(抽取事实的种方法)等在数量和体量的增长。这些需求刺激作者开发一个基于服务器的文献分析方法。Whatizit就是一套用于分析文献(任何科学论文或者Medline文摘)中蕴含信息的模块。

其特有的模型可以辨认专业术语并将这些术语链接到诸如Uni-ProtKb/SwissProt等数据库条目和基因本体中概念。

其他模块辨认一组选定的注释类别,如EBIMed分析流程分析蛋白后产生的集合。

对于Medline文摘,该工具提供登录EBI内部插件,输入PMID或者词查询。

对于用户自己的大规模的文本,服务器可以在流模式中运行。

(HTTP://WWW.EBI.AC.UK/WEBSERVICES/WHATIZIT)




https://blog.sciencenet.cn/blog-82196-991771.html

上一篇:利用共同邻居推理网络几何机构(译文)
下一篇:技术抽离了情感?
收藏 IP: 59.46.93.*| 热度|

2 魏瑞斌 libplayer

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-22 09:00

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部