|||
项目描述:
此次参与的EOL鲁宾斯坦伙伴计划的项目内容是“利用EOL已经收集的生物分类树(名录)进行比较分析,计算各种分类系统之间的重叠与差异的程度”。生物分类名录在生物多样性研究及生物分类等领域都有重要的作用。各种不同分类系统的出现主要是由于:
1. 分类学家对同一生物类群有不同的分类观点
2. 分类手段如分子系统学等对传统分类体系的修正
3. 新物种或标本的发现引起对旧分类系统的修正
4. 生物分类名录的地域局限性
因此,进行生物分类名录的比较有迫切必要性,也是生物多样性信息学研究的重要内容之一。目前EOL已经收集将近20个分类名录,各名录所覆盖的类群、区域、采用的分类体系都不尽一致,因此提出对这些名录进行分析。考虑到名录比较分析具有长期持续意义,本项目将实现一个生物名录的比较工具Taxonomic Hierarchy Comparator (THC),并将拓展项目的内容,使用户能够使用该工具将自己的名录与EOL的所有名录进行比较。
THC的潜在用户:
生物多样性信息学研究者:分析名录差异,查找数据间隙(gap),建立名录间关联。
生物分类学家:发现自己的分类观点与他人的差异与相同之处。
主要功能需求:
1、用户管理:用于用户的注册、授权、信息更新等,也便于用户相关分析实验结果的保存和共享。
2、分类名录管理:
a. 创建名录: 从EOL的Web API获取;用户上传xml创建等。
b. 共享名录:与指定的其他用户共享自己的名录
c. 导出名录:保存为标准格式xml文件或excel
d. 编辑名录:新增、修改名录中阶元
3、分析实验:
a. 创建实验:提供实验标识;选择要比较的名录
b. 执行:采用任务队列执行,因为过程比较耗时
c. 可视化:对结果进行可视化展示,可直观看出名录差异
d. 计算:进行交集和差运算,提取相同与不同的地方
本文摘录自《THC的需求分析》
作者:林聪田,2013 EOL Rubenstein Fellow
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-4-27 22:28
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社