zhuchaodong的个人博客分享 http://blog.sciencenet.cn/u/zhuchaodong

博文

三个问题:分类学家如何在世界范围内生存和发展?

已有 3336 次阅读 2020-2-3 21:05 |个人分类:思路随想|系统分类:论文交流

三个问题:分类学家如何在世界范围内生存和发展?

Three questions: How can taxonomists survive and thrive worldwide?

MICHAEL C. ORR, JOHN S. ASCHER, MING BAI, DOUGLAS CHESTERS & CHAO-DONG ZHU

Megataxa 001 (1): 019–027

https://doi.org/10.11646/megataxa.1.1.4

摘要

分类学目前面临许多挑战。在如何才能最佳地延续描述并理解生物多样性的重要实践方面,仍然存在许多问题。在这里,我们讨论了如何最好地实现现代化分类、如何改善发展中国家的分类实践、分类学家如何能形成更好界面与其它科学领域融为一体等问题。

介绍

分类学是生物学的基础,由分类学家划分的物种已经成为数百年来分析的核心单元(Wilson2004)。在这里,我们讨论了分类学实践未来的三个核心问题,依次是从分类学革命的基本需求到区域性乃至全球范围内应用分类学的实践要素。在第一个问题中,我们要解决分类法被低估的问题,以及如何解决这一问题。从本质上讲,我们如何才能对分类学实践进行革新以改善我们的领域?然后,我们将第二个问题集中于如何在巨大生物多样性尚未描述的发展中国家,最好地促进分类学实践,即我们在最需要的地方如何建立分类能力?最后,我们探索如何通过单一物种数据存储库,更有效地统一分类学和相关数据,并回答我们如何与其它科学实现最佳链接的问题

1.       “ 当分类学家也是受威胁物种时,我们如何在物种灭绝之前命名呢?

人类引起的气候变化和无数生境改变或直接的收获活动,使我们面临自己造成的前所未有的生物多样性危机,但我们却几乎不知道失去什么物种(Singh2002; Yap 等,2015; Malcom 等,2019)。成千上万的无脊椎动物,甚至还有一些脊椎动物仍未被描述。尽管有的有描述(无法识别)但仍未被辨认,但更多仍未被发现(Giam 等,2011; Mora等,2011; Stork2018)。根据现行法规,如果我们不知道物种名称,就无法(通过IUCN)评估和正式保护它们。这样的评估中,昆虫等多样性高群体通常代表性很差(LaSalle  Gauld1991Clausnitzer2009; Cardoso 等,2011; Eisenhaur 等,2019)。

分类学是发现,描述和识别物种所需的领域,其价值正日益被低估,几乎没有可用的资金机会和长期职位(Lee2000Agnarsson Kuntner2007 McClain2011)。自1950年代以来,专业分类学家和业余分类学家都提出了应对长期下降的建议(Hopkins Freckleton2002)。但是,情况很复杂,因为年轻分类学家现在仅凭传统做法很少能在学术界取得进步。系统发生学、功能形态学等现已成为常规支柱方向。对于某些类群,甚至出现了更多的分类学家,和先前描述的相似数量物种(Bacher2012Tancoigne  Dubois2013)。但是,目前尚不清楚这种现象是否会持续下去。无法保证描述物种的研究生,他们可能会代表其中许多描述工作者,能获得职位以确保他们继续描述物种;我们不了解类似的职业生涯分析方法。因此,随着上一代人退休,拥有真正可持续职位的分类学家可能剩余得太少,无法培训下一代进行这项重要工作。

如同所编目的生命一样,分类学必须适应以生存和发展。至关重要的是,这些新方法应更多地关注物种描述,以帮助解决生物多样性危机。尽管存在高影响力” 物种描述的示例,但它们在化石类群、高知名度物种的分裂或高等分类单元变动之外很少见(Shu等,2003 Berger等,2010 Haile-Selassie2015 Orr等,2016 Bai等,2018 Su等,2018 Yan等,2018)。必须通过采用强大的新方法和技术来革新分类学,而不是取代分类学,来填补分类能力不断扩大的缺口。

当前描述和修订速度无法确保我们能够在绝大部分物种灭绝之前就对其进行识别,迫切需要分类学家使用新技术来加速其描述性和修订性工作(Bacher2012等)。物种鉴定同样重要,对于任何给定的分类单元而言,通常只有很少的专家。长期以来,人们一直建议使用DNA条形码或DNA分类法来解决这一问题(Hebert等,2003; Tautz 等,2003),但是在方法论上和北半球温带过度取样地区之外,都是增量式进展(Janzen等,。,2009泰勒和哈里2012;派珀等,2019年)。这可能会导致参考数据库严重不足,从而无法把标本准确识别到属,而物种水平更少。因此,截至2014年,Chesters  Zhu发现他们所界定的公共序列中约有194,000个(超过一半)没有确定的分类学信息。数据质量是一个完全不同的问题,在本文中无法解决。如许多COI假基因已经在线,但作者很可能根本没有进行检查,而线粒体的异质性也可以混淆分析。无论如何,要获得这些数据,许多研究都依赖于对所有标本进行直接测序,这可能会占用项目的大部分工作时间和资金(Tang等,2015 Yeo等,2019)。下一代方法被认为是一种高通量而低成本的解决方案。但是,直到现在,强大的宏条形码和宏基因组学方法才开始显现出对准确定量大批样品中丰富度的希望(Lang等,2019; Peel等,2019; Piper等(2019)。低覆盖率基因组测序方法也可能被证明是有前途的,因为这些数据可以轻松地用于系统发生或种群基因组学以及其它目的(Zhang et al.2019 )。但是,即使完善了这些方法,除非存在足够的参考序列以1)界定物种和2)准确应用物种名称,否则这些方法仍将与正式命名法割裂。由于最近关注条形码标本以及它们的各种相关物(微生物组、食物来源、寄生虫等),即使使用强大的分子方法,也需要跨类别的分类研究人员来准确有效地解决生物多样性危机。

整合分类学的思想,即使用新的、多样方法来鉴别和描述物种,是分类学革命的核心(Dayrat2005)。近年来,DNA 方法已成为人们关注的焦点,但是外部形态实际上可能将来也同样有用,特别是考虑到这是非破坏性并且更直接地与功能相关。长期以来,人们一直建议使用人工智能图像识别技术来识别昆虫等物种丰富的群体(Weeks等,1999)。即使对于受过良好训练的分类学家来说,隐存物种也难以区分界线,但是现代机器学习方法正在极大地改善前景(Buschbacher等,2019年)。尽管许多方法都依赖于易于量化的特征,例如昆虫的翅脉,这些昆虫在某些年龄较老标本或大量诱杀标本中已被损坏,但改进成像分辨率和识别算法的增加了可用特征范围。事实上,这些系统甚至已经以令人惊讶的,不断增加的精度用于公众科学平台,如iNaturalist ,(罗伯逊等,2019)。这些方法不仅限于聚焦外部特征(例如颜色或毛发)的传统方法,内部解剖结构对于推进分类学同样具有甚至更有希望。尽管分类学家已经书写了数百年的外部鉴别和描述,但绝大多数物种甚至从未被完全解剖过,尤其是较小的,难以解剖的标本。诸如microCT之类的技术可提供难以置信的内部硬和软结构图像(Friedrich等,2014; Wipfler 等,2016; Short等,2018),从而比以往任何时候都能够更好地了解形态学、生活史、物种形成之间的相互影响。

这些形态数据源在一起具有巨大的前景,不仅可以补充分类学,而且可以使分类学现代化。人工智能一旦使用了由分类专家指定并经过验证的物种图像进行了适当的训练,就可以轻松地从外部和内部解剖结构的图像中提取用户定义的特征度量值。这些记录存放在形态特征中心数据库中,每个物种有多个个体。这些记录将为这些物种提供严格的定量鉴别数据和定义。当遇到标本不在已知物种范围内的标本时,可以将它们标记为潜在的新物种,并由分类学家进行验证;然后可以从数据库中自动化形成更完整的物种描述,可以比在任何当今物种名下中都可以看到更多特征和详细度量。甚至可以通过识别与记录的最相似物种最不相同的特征组合来自动进行鉴别。通过添加密切相关的新物种,甚至可以使用新信息更新这些鉴别,以保持其有用性。某些小组已经采取了第一步,对分类学进行了修订,纳入了3D建模和成像技术(Hita - Garcia等,2019Sarnat 等,2019),但是这些实践尚未广泛应用。有了足够文档,这样的系统甚至有可能仅从公众科学观察中描述新物种。这并不是一个全新的主意,因为存在一些物种图像库(MorphBank2019;其它),并且已经从图片中描述了物种(MarshallEvenhuis2015; Garraffoni Freitas2017)。然而,由于细节不足和其它众多原因,目前的方法被认为存在缺陷(Lobl 等,2016; Santos等,2016; Dubois2017;GutiérrezPine2017)。在分类学家的指导下,尤其是与DNA数据结合使用时,我们这里概述的方法有可能弥合这一差距。

最终,我们在这里提出的解决方案代表了分类方法的重大转变。这些技术要像现在的传统分类方法一样容易使用。尽管如此,我们必须开始过渡到这个或其它新的分类学框架,以确保未来的方法保持传统分类学基础上的最佳实践和严谨性。分类学家只有引领不断变化的潮流,而不是被其所取代时才能够生存。

2.       我们如何改善发展中国家的分类学?

发展中国家的生物多样性情况十分严峻。随着社会及其相关经济与人口增长(有时人口过剩)一起发展,更多的土地被转变用于农业、人类居住和其它形式的基础设施。这发生的速度比其它地方快,因为这些国家通常仍有许多自然或半自然栖息地,从而留下了更大的发展空间。此外,由于发达国家在发展中国家进行投资,转让技术以加速自然资源的开采、建设等,这些国家的景观改造速度比以往任何时候都快得多(Kaimowitz2019)。许多发达国家已经发生的那样,动物多样性正在大量减少,但还有许多生物多样性尚未丧失,相关各方都有责任(Eisenhaur 等,2019; Rosenberg等,2019; Wagner2019)。值得注意的是,那些目前发达国家最初所包含的物种比现在发展中国家要少得多,特别是在热带和亚热带国家中有大量类群的物种(Giam等,2011Waldron等,2013),因此损失的规模可能会更大。

生物多样性的丧失对发展中国家尤其有影响,因为发展中国家的教育基础设施仍在日趋成熟,人们对自然重要性认识不足。动植物通过多种贡献极大地改善了人类的生活质量,包括分解、药品或其它产品、害虫控制、授粉等(Cardoso等,2011 Diaz等,2018)。生物多样性对于粮食安全至关重要,这是需求不断增长的发展中国家(如中国或印度)的一项重要宗旨。如果我们无法确定参与这些服务的物种并辨别它们的贡献,那么我们将很难轻易地保护它们中的任何一个。同样,新的有害生物种类仍未描述,其自然历史未知,随着农业和人类栖息地的激增,这将成为问题(Parsa 等,2014)。当农作物在自然界中转移和引入时,这尤其是个问题,因为这些害虫可以作为入侵物出口到其它地方。许多此类害虫可能被误认为是其它当地已知物种,后者具有不同的威胁,拥有大量的天敌但不会攻击新害虫,其检测将被延迟。由于这些原因,我们必须提升发展中国家的生物分类能力。

首先,工作必须集中在当地研究人员的能力建设上。至关重要的是,各国必须成为科学上独立的国家,而此类基础设施已经存在的发达国家可以在这一过程中发挥至关重要的作用。发展中国家分类学的一个主要障碍是许多命名标本体系的标本存在于其本国之外。例如,T.D.A. Cockerell描述的数百个世界各地的蜜蜂物种,现在都存放在美国多个博物馆。这意味着中国研究人员可能需要预算才能访问多个博物馆,以便查看单个研究人员在一个国家或地区,包括华盛顿特区和纽约市等昂贵的地区的模式标本。因此,访问资金至关重要。幸运的是,在这些地区或国家,主要的昆虫博物馆,如美国国家自然历史博物馆、美国自然历史博物馆,现在都在数字化模式标本图像;有些机构,柏林Museumfür Naturkunde已经开始大规模数字化,努力和公众分享并展览成果(Naturkunde2019)。模式标本数字化是所有博物馆必须采取的关键步骤,至少要将数字化生物分类知识以数字方式返还到可能尚未建立基础设施的标本的故乡地区,以在当地专业知识和基础设施建设之前安全地存放它们,例如,《柬埔寨昆虫学倡议》(CEI2019)。同样,对于发达国家的博物馆来说,提供经过验证的参考数据以支持这些类型的倡议也非常宝贵。建立当地能力和基础设施必须是一个目标,因为生物收集对于识别这些物种的发源地最有用。此外,当地参与对于知识交流至关重要,特别是对于与分类和保存有关的土著知识,从而为外部和本地研究人员及其社区之间的协同增效提供了清晰的途径,否则这些知识可能会丢失(Sheil Lawrence2004Nazarea2006Ayala等,2013年)。同样,访问研究人员可以提供有关分类实践、馆藏管理和数字化的关键培训(Klopper等,2002 SmithFigueiredo2009 GBIF2016)。外部资金也将是必要的,特别是对于建立合适的馆藏基础设施和数字化能力(GBIF2019)。即使在发达国家,博物馆的资金也已不足,因此不能期望它们都为这种拓展性措施提供资金。鉴于发达国家在殖民主义和其它实践中的广泛作用,联邦政府在道德上有义务为这些努力提供必要的资金,并且可以由诸如全球环境基金或联合国环境署之类的机构来筹集和管理一个集中的生物多样性和生物分类学基金。这些资金还可以用来组成由国际和本地研究人员组成区域工作组。随着工作组确定和指导资源以解决不同领域最相关的问题,将进行直接的知识转移。数据集中化和可访问性也必须得到优先考虑,因为这样的努力将使附近的其它国家受益,而不论它们是否直接参与,同时也为国际研究人员投入更多的时间投入这种努力提供了更多动力。显然,还有很多工作要做,但是如果我们不开始,我们将永远无法完成。

在没有国内合作者的情况下,开展远征性获取式科学的时代即将结束。现在是科学家共同努力在全球范围内建设能力的时候了。现在,《名古屋议定书》和各种国家层面的法律基本上都在不同程度上禁止外部研究,这使得在许多地方几乎不可能输出标本(Prathapan et al.2018 )。这到底是净损害还是利益是另一个问题,但现实是我们必须适应不断变化的立法,因为立法者不太可能直接解决我们的担忧。各国在维持和维持经济和社会方面有明显的动力,以更好地控制其生物资源(生化勘探、优先安排本地研究人员等)。如果我们要建立一个真正的全球科学共同体,就必须与当地专门的研究人员建立可持续的伙伴关系。

3.       我们如何最优地将分类数据转换为'大数据'?我们如何将分类学知识导出到其它领域?

分类学是几个世纪以来的主要生物科学(Wilson2004)。在此期间,成千上万的研究人员和业余爱好者收集了超过十亿保存下来的标本(Short等,2018)以及对世界各地物种的其它观察记录,包括分布、物种相互作用(食谱,寄生等)、形态的记录、物候学等等。但是,与DNA 数据相比,尽管付出了巨大努力来调动这些数据(GBIF2016; GBIF2019; iDigBio2019; MorphBank2019;和其它),许多自然历史信息仍未得到使用。关键区别在于,在该领域发展的早期,GenBank平台(NCBI GB2019)就可以从单一来源获得大多数公共遗传数据,而不是像自然历史信息一样散布在成千上万的文献中。

尽管存在这些局限性,依赖博物馆标本或自然历史,可以研究包括探索整个生命周期中的大范围格局及其驱动因素(Isaac等,2004)、利用种群基因组学重建种群历史(Rowe等,2011 Bi等,2013)、发现蜜蜂和其它无脊椎动物数量下降及其后果(Gallai 等,2009Bartomeus 等,2013Eisenhauer 等,2019)等等。如果没有分类学家的努力和指导知识(提出正确的问题,纠正错误等),这些研究就不可能发生。即使到现在,大量数据仍然被锁闭在博物馆、清单、物种描述、自然历史记录和分类学家的思维中。我们如何才能最优地利用我们的知识来改善科学?

先前的两个问题都暗示了创新。这些创新将帮助我们革新分类学并改善整个生物学。具体而言,通过人工智能对标准化度量结果进行数字化处理以及对所有模式标本进行数字化,可以共同构成其潜力不可匹敌的数据集基础,但是还有无数其它数据类型,包括无数标本相关数据(物候、关联等)、遗传数据、分类或其它物种为基础的出版物等,也可以将其合并到单个主物种数据库中。在该系统中,每个物种条目都将包含该物种的所有相关可用信息,以便科学家和公众都可以从一个站点了解他们想要了解的关于地球生命的所有信息。这些数据的扩展是无止境的,包括直接生成不断更新的、数据驱动的生命树,以及类似的物种丰富度模式的实时模型,以增强全球范围内的保护规划工作。当前的尝试只能被认为是初步的,例如《生命百科全书》(EOL2019)之类的资源还不足以引用遗传信息、模式标本图像等。至关重要的是,不同的站点通过尝试以略有不同的方式实现相似的目标而分散了精力和资金(提供不同的数据类型或分类、针对不同的分类单元或区域),但是只有通过统一的努力才能实现这样的宏伟计划。同时,DiscoverLife 2019)、iNaturalist 2019)和BugGuide 2019)等公众科学门户网站已经构建了新的、动态和互补的工具,尤其是在授权众多虚拟管理员(理想的分类学家)以确保数据质量方面,可以有效地应用于此集中式系统,从而大大提高其可靠性和可用性。

这项事业显然需要巨大的基础设施和资金支持,特别是考虑到需要严格验证(Costello等,2013; Costello Wiekzorek2014),但是当考虑到GenBank 平台的巨大成功和当前为动员收集数据所做的努力(Cobb et al.2019)时并非没有可能(NCBI GB2019 )。汇总所有此类数据的任务不是一件容易的事,但将来只会越来越难,特别是考虑到过去几十年来科学出版物的发展(Larsen Von Ins2010),需要形成了一个分类学家都和生物学家一般绝对必需的统一物种数据系统。

此问题和第一个问题最重要的关切是,如何使各方都能公平地进行合作安排。乍一看,建立物种信息统一存储库的想法似乎不利于分类学,因为这将使其它研究人员更容易访问大量的所有数据类型,并有可能在数据库建立后(足以满足其给定的分类单元,从而避免与数据生成和验证所需的关键类群专家进行互动),将分类学专家从整个过程中删除。该过程的关键的检查步骤将是研究人员与非科学用户(如保护主义者和政策制定者)之间的使用共识。尽管所有在线数据都是可以搜索的,并且拥有至关重要的资源(如强制公开的模式标本图像),但未经数据所有者许可,某些资源仍将无法访问(例如,非公共分布清单、未发布的基因组程序集或某些性状数据集,例如TRY2019 。这将使分类学家在数据用户方面拥有更大的覆盖范围和可见性,同时也使他们可以更好地控制其数据的实际使用方式。每个物种条目也可以充当可引用的在线对象,通过增加其它出版物和指标(例如Hindex)为分类学家提供更多好处,这些出版物和指标目前对学术界职业发展非常重要(这是否一件好事是完全不同的事情)。此外,研究人员还可以避免在特定主题上的无意识竞争,而选择合作。这样非分类学家就可以更好地了解存在哪些数据,而不仅仅是公开哪些数据。研究人员之间的直接联系也将鼓励交互对话,从而使分类学知识可以为生态分析中参数选择和模型校准提供信息。尽管真正开放的科学是一个崇高的目标,所有数据都可以即时免费获得,但是如果没有这种类型的基础架构所带来的更多认可和支持,数据生成者就不会参与其中。该计划有可能再次将生物分类知识集中于生物学,同时还为参与的生物分类学家提供资金和合同,以便下一代研究人员可以继续他们的重要工作并最终解决生物多样性危机。

致谢

我们感谢Alice C. Hughes博士的宝贵讨论和支持。感谢博士张志强盛情邀请,他和Celso Azevedo博士对手稿的改进。



http://blog.sciencenet.cn/blog-536560-1216814.html

上一篇:人类世动物区系丧失
下一篇:Journal Club:人类世动物区系丧失模式、原因及后果

2 张珑 王焕冲

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2020-4-5 12:48

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部