zhuchaodong的个人博客分享 http://blog.sciencenet.cn/u/zhuchaodong

博文

开发识别技术,加速物种分类学研究进程 精选

已有 7420 次阅读 2017-4-9 18:22 |系统分类:科研笔记| 大数据, 模式识别, 昆虫分类, 物种识别

注:下午,彦周把原西德出产的OPTON解剖镜搬到实验室,笑言这是我的最爱。诚哉,知我者如彦周。自我入动物所,进师门求学,黄老师就把这台解剖镜交给我使用。当时这台镜子还没有和计算机相联的配件,也没有拍照的设备。它助我构建姬小蜂亚科性状库,领会到小蜂分类之精妙,陪伴并见证了我在生物楼216房间的博士生的日日夜夜。后来出国访学,用过其它几种镜子,总有不顺手之感。归国后多次向恩师请用此镜。因研究所搬迁之故未得。今获赠此镜,我又回想起入学之初,恩师谈小蜂、谈分类、谈计算机技术的发展,纵论学业之艰、学科之难。联想现今昆虫分类学及相关方向发展,草就“开发昆虫识别技术,加速物种分类学研究进程”博文,聊记随想。期待昆虫分类学同仁抓住学科交叉机遇,兼收并蓄,老树绽放新花。

一篇重要文献,值得后续研读、参考:A survey on image-based insect classification.pdf

开发识别技术,加速物种分类学研究进程

在传粉昆虫多样性研究过程中,我们经常会遇到昆虫物种鉴定的问题。作为特定类群(部分小蜂总科和蜜蜂总科昆虫)的分类学工作者,对重点研究的属种进行快速、准确的鉴定比较有把握。但是,对这些类群中的其它属种,则需要长期的分类、鉴定经验的积累;跨越到其它的总科或者目,则一般只能提供一个大概的范围。以最近曹焕喜同学完成的中国柄腹姬小蜂属物种修订为例,虽穷尽数年求索,仍有很多物种需要慢慢积累,才能完成分类学过程。2010年访问澳大利亚国立昆虫博物馆John LaSalle博士。他是Graham和Boucek博士之后,姬小蜂科分类学的权威专家。他的两句话让我记忆时刻:1)每年他深入研究的姬小蜂科物种不超过10种;2)啮姬小蜂属(Tetrastichus)已知物种太多,想开展工作需要进入疯狂的状态。由此可见,仅仅依靠解剖镜和模式标本,分类学者物种鉴定工作之难。

这就是我2007年以来参与一些农业项目后,感受比较深的专业体会。经常有不同领域的专家咨询我其它类群的昆虫鉴定问题,我均如实相告:很难鉴定,将予以协助。因此,我组织了昆虫分类鉴定研究群(群号:85931581),吸引更多的专家、研究生和爱好者加入进来。通过这个群,一方面可以跨类群分享分类心得,也可以更好解答来自农业、林业、植检等领域的昆虫鉴定问题。现在这个群一直处于满员(2000人)状态,并另外设立了鞘翅目(群号:567945335)、鳞翅目(群号:207186496)、双翅目(群号:581014082)和膜翅目分群(群号:579133308),由这些类群的专家管理。

即便如此,基于社交媒体的分类鉴定的问题仍然存在:1)越来越多通过智能手机采集并上传的图片,无法得到及时归类整理;2)专家无法从大量的图片中获得有价值的分类学、地理分布信息;3)图片采集者需要获得初步鉴定信息,从而有更多的兴趣参与;3)专家同样需要从筛选出来的信息中,获得正向反馈,更加积极参与到昆虫相关知识的科学普及工作中。观鸟数据的大量积累,为鸟类有关研究奠定了大数据基础。我预期在未来数年内,和有花植物密切相关的传粉昆虫,将产生大量的观测数据。但是在现阶段,显然分类学专家不太可能把时间花在群里,反复查找有价值或者感兴趣的图片,并给出答案。

除了传粉昆虫,自然界中还存在更多的其它生态功能的昆虫,如捕食性昆虫、植食性昆虫、寄生性昆虫、分解者昆虫、腐食性昆虫等。对这些功能和形态各异的昆虫类群进行多样性监测,显然难度要比传粉昆虫大得多:很少有人对这些昆虫感兴趣并主动观察并收集相关数据。有些昆虫,如蝴蝶成虫期,大家都很喜欢,而对幼虫期则比较恐惧。一般公众对昆虫,特别是生物学还是缺乏了解。这样的情况下,运用马来氏网、拦截网、喷雾法等方法,就可以比较有效开展不同功能群昆虫的采集。然而采集容易,分类仍然是物种多样性研究的瓶颈。传统的研究思路是选择部分不同的功能类群,如捕食性+植食性,开展经典分类学研究工作,并统计出多样性指数。这项经典工作的优势在于:多样性数据背后的物种鉴定得到了世界顶尖专家的确认,并留下大量的证据标本,存放在重要的标本馆内供后人查考。显然这样的工作非常重要,但耗时耗力,很难给短期监测项目提供支持,也很难争取到长期的经费支持。巴拿马热带雨林的一个多样性项目,大约有100个科学家参与。其中大部分科学家是不同类群的分类学专家,花了约10年的时间,把收集到的标本进行分类鉴定(http://www.sciencemag.org/news/2012/12/panama-forest-boasts-tens-thousands-arthropod-species)。

宏条形码技术的发展,则为昆虫多样性监测提供了一个基于分子的快速选项(doi: 10.1111/ele.12162 )。该技术借助飞速发展的二代测序技术和快速增长的DNA条形码数据库(http://www.boldsystems.org),实现了不同地区、不同生态类型马来氏网样品的快速物种多样性估计,并被迅速被引用到非常有趣的生态学研究工作中,如非洲植食性动物挑食(http://www.sciencemag.org/news/sifter/african-herbivores-are-fussy-eaters)、海洋浮游生物群落结构(http://science.sciencemag.org/content/sci/348/6237/1262073.full.pdf)等。这类工作的优势在于:多样性数据基于DNA条形码,间接获得了分类学专家支持,并和高通量测序技术接轨,容易得到资助。然而,从分类学的角度,它的缺点非常明显:需要大量生物信息学手段参与数据分析,而不是分类学信息的整合;样本得不到保留,无法供分类学工作者慢慢研究并发现新物种。另外,由于DNA条形码和经典分类学工作进度之间的时间差,大量DNA条形码并没有得到分类学的确认。

最近新的基因组计划已经提出,我也从分类学的角度进行了思考,并建议:在大科学、大数据科学工程中要注意吸纳已有的科学知识和人力资源,形成有机整合;同时需要关注并加强对源头创新队伍中青年人才的长期培育。然而,另外一方面,昆虫分类学工作者在见证分子生物学、高通量测序等的飞速发展的同时,也可以考虑如何参与并加速物种多样性的科学研究进程。马来氏网、拦截网和喷雾法等采集方法初步解决了物种多样性的第一步采集环节。图片和DNA数据,乃至基因组,难以百分之百解决物种鉴定问题。但是,关注新技术,并超前设想并规划引用新技术,兼收并蓄,至少可以加速物种多样性发现甚至描述过程。

图片数据库的建立为其它生物开发物种识别提供了便利,如形色(https://itunes.apple.com/cn/app/形色-会上瘾的识花神器/id1018747351?l=en&mt=8)、智能花卉识别系统(http://www.chinadaily.com.cn/interface/yidian/1138561/2016-08-10/cd_26422376.html)等。而昆虫尽管物种多,网络图片也多,但是还没有整合,更缺乏较好的终端识别工具。超高清相机、图片数据库、模式识别和机器人技术相结合,应该可以把大量的样品进行大类区分、分拣。同时,智能手机、图片库、模式识别和互联网技术结合,同样可以实现这一点。如果实现了目、科甚至属的大类分拣,经典分类学工作者就可以集中精力,把最宝贵的经验和技能在物种鉴定环节上。这样可以大大提高物种鉴定效率和准确率,并使分类学者带着物种问题,应用DNA条形码、宏基因组学等新技术开展研究工作。这样的模式,将不仅解决分类学障碍问题,还将在获得大量数据的同时,保存下证据标本,为后人留下宝贵财富。

分类学从来都不是孤立发展的一门学科。新一代测序技术、互联网技术、超高清相机、图片数据库、模式识别、机器人技术等,如何和经典分类学有机整合?如何开发一个市场认可并欢迎的昆虫识别技术?有了识别技术的雏形,昆虫分类学应该会有更高的学科和社会的认可度。欢迎各位同仁提供宝贵信息,共谋进程。

参考文献:

. 2011; 2011: plr004.

Published online 2011 Jan 21. doi:  10.1093/aobpla/plr004

Image use in field guides and identification keys: review and recommendations

*Corresponding author's e-mail address: ude.gcnu@ffohcrik




https://blog.sciencenet.cn/blog-536560-1047778.html

上一篇:果树授粉的几个问题
下一篇:深度学习助力提升物种鉴别效率
收藏 IP: 124.166.233.*| 热度|

13 戴小华 李心诚 谢强 陈华燕 王德华 李颖业 王代平 赵斌 谢平 高建国 蔡庆华 guhanxian biofans

该博文允许注册用户评论 请点击登录 评论 (13 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-20 09:56

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部