zhuchaodong的个人博客分享 http://blog.sciencenet.cn/u/zhuchaodong

博文

膜翅目基因组

已有 2494 次阅读 2018-3-4 07:23 |个人分类:论文精读|系统分类:科研笔记

膜翅目基因组

作者:Michael G Branstetter1, Anna K Childers2, Diana Cox-Foster1, Keith R Hopper3, Karen M Kapheim4, Amy L Toth5 and Kim C Worley6

1 Pollinating Insect-biology, Management, Systematics Research Unit, USDA-ARS, Logan, UT 84322, United States

2 Bee Research Laboratory, USDA-ARS, Beltsville, MD 20705, United States

3 Beneficial Insects Introduction Research Unit, USDA-ARS, Newark, DE 19713, United States

4 Utah State University, Department of Biology, Logan, UT 84322, United States

5 Iowa State University, Department of Ecology, Evolution, and Organismal Biology and Department of Entomology, Ames, IA 50011, United States

6 Human Genome Sequencing Center, and Department of Molecular and Human Genetics, Baylor College of Medicine, One Baylor Plaza, Houston, TX 77030, United States

 

译者:周青松、王明强、李逸、张仁杰

 

膜翅目是节肢动物中获得基因组测序第二多的目,现有52个公开基因组(包含蚂蚁基因组共有71个)。然而,这些基因组还不能有效的覆盖高度多样化的膜翅目(见图1,表1)。目前已获取的基因组仅能代表膜翅目现存97个科中的15个科。尽管还有其他11个科的55个基因组正在进行中(表2),但针尾部基因组就占据了现有基因组中的35个(67%)以及正在进行中基因组的42个(76%)。我们需要一个更加全面的膜翅目昆虫基因组目录来探究该类群复杂多样性背后的生态、行为和生理学特性的演化过程。我们还需要对预计100万种膜翅目种类中的0.05%的种类进行测序、组装。同时我们建议优先对该目中已知命名的15万种物种中的至少1%的物种进行基因组研究。膜翅目昆虫的单双倍体性别决定机制,使得使用单倍体的雄性进行测序可以帮助简化基因组的装配问题的最小化,并获取更高质量的基因组。

 

引言

膜翅目是一个十分古老并具有高度多样性的类群。其化石记录可以追溯到三叠纪[1],现已描述物种超过15万种,其物种丰富度估计约有100万种[2,3]。作为昆虫纲四大目之一,膜翅目物种丰富多样,包括叶峰和树蜂(广腰亚目),寄生蜂(寄生部)和蜂类(针尾部),包含了遍布全球并且在生态上占据主导地位的蚂蚁、蜜蜂和一些营社会性生活的蜂类。膜翅目昆虫极其多样化的生物学特性使其具有非常重要的经济意义(如:生物防治和传粉),并因此成为第一批受益于昆虫基因组测序的昆虫类群之一[4]。尽管一些额外的的基因组已经完成测序(表1)或者正在进行中(图1,表2),但对其他28总科978422属中的大多数谱系来说,基因组资源仍然十分匮乏。在此,我们就改善膜翅目基因组状况的已有观点和机遇展开讨论。(注:蚂蚁类群是单独进行综述的)。我们提议的未来膜翅目基因组测序的路线图将会优化膜翅目研究团体的收益。

 

膜翅目基因组特点

膜翅目基因组有一些显著且独特的特点。首先,膜翅目是单双倍体性别决定机制:未受精的卵发育成单倍体雄性个体,受精的卵发育为二倍体雌性个体[5]。单双倍体性别决定机制不但引发了与性别决定、性比控制以及亲缘相关等令人惊奇的生物学现象,也对基因组测序很有帮助。有时单个较大雄性个体就能够提供足够满足基因组测序且未有基因变异的DNA(例如[8])。其次,一些膜翅目昆虫基因组具有极高的重组率,对社会性种类来说尤是如此,如蜜蜂的基因组重组率是所有已知生物中最高的[9]

在所有的已知的基因组中,除少数例外[10,11,12],膜翅目基因组大小比较稳定(80%种类的基因组大小在180-340Mb之间)。大多数种类拥有1.2-2万个基因(注意此处的基因数量的计数与注释的流程以及组装的连续性高度相关[13]),有着较低的重复率和较少的转座子。另一个与众不同的特点是较低的GC含量,膜翅目物种的GC含量的变化范围在30%~45%之间[8]。尽管基因组GC含量较低的原因尚不清楚,但其可能与GC偏向性基因转化以及较高的重组率有关[14]。由于基因组相对较小且结构简单,膜翅目基因组的测序和组装相对较容易进行。

 

潜在的基因组水平上的膜翅目生物学研究

膜翅目昆虫几乎包括了各种不同的功能昆虫群,从植食者到传粉者、捕食者再到寄生者,并且这些扮演不同的生态角色的物种都具有一系列复杂的生理和行为学的适应特征。基因组学研究已经在传粉昆虫健康和利用寄生蜂生物防治相关应用问题方面提供帮助[17]。比较基因组学的方法有助于人们进一步对这些适应机制的分子进化基础的理解包括如真社会性的进化[8,12,18],社会性寄生[19,20],毒性机制[19,20,21,22],和寄主行为特异性[23,24]

传粉者的健康(保育)和管理研究极大获益于一些重要的传粉类群的参考基因组(表1)。利用基因组研究传粉者的健康能够让我们筛选疾病,阐明寄生虫的影响,并调查传粉者针对环境因子和病原体所产生免疫效应。例如:开发新的反应蜜蜂群健康状况的生物标记[25–29];描述苜蓿切叶蜂(一种的独居传粉蜂)的环境应激反应和最佳发育温度策略[30,31];开发野生和人工管理蜜蜂基于基因组和转录组的其他健康指标[32–39]。蜜蜂基因组营养研究已经对蜜蜂健康机制有了深刻的理解并在这方面硕果累累[40–43]。将这些新兴领域拓展到本地野生蜜蜂能够从另一个角度来探究受栖息地丧失制约的自然食物资源是如何影响蜜蜂健康[44]。该方法还能提高我们对蜜蜂的先天和后天获得性免疫功能的理解,这对蜜蜂管理与保护工作至关重要[45,46]

膜翅目中绝大多数物种是寄生蜂(1 和表 2绿色部分),并且大部分昆虫能够被至少一种寄生性膜翅目寄生[47–51]。伴随复杂和紧密的寄主-寄生者种间关系[52]和狭窄的寄主范围[53],这些都能够驱使生态物种形成[54,55]。在生物防治中寄生蜂是入侵害虫重要的天敌,具有重大的经济价值,减少害虫的数量和危害,相对于杀虫剂来说更安全、廉价[56]。因此,了解气候适应和宿主特异性等特征的遗传结构和进化是至关重要的。此类研究揭示了寄生蜂克服寄主的免疫系统的各种机制,包括毒理和免疫抑制因子,如多DNA病毒和类病毒微粒,专性原细胞(特化的胚胎细胞)以及幼虫分泌物[57–59]。寄生蜂也能控制寄主的内分泌系统,导致寄主发育紊乱[60]或者操纵寄主行为[61,62]。最近揭示了微生物会改变寄生蜂的进化历程并影响与寄主之间的互作关系,这也表明还有很多未知的现象和机制有待发现、探索。特别指出的是,整合病毒的茧蜂科和姬蜂科基因组要比预期的要更加复杂[63,64,65]。正在进行的能够寄生同一寄主的三种寄生蜂的基因组,已经发现每种寄生蜂克服寄主免疫系统和其他的防御系统的机制各不相同(M. Strand, personal communication)。相较于仅使用系统发育来说,比较基因组学能揭示更多信息,伴随着Nasonia (金小蜂科Pteromalidae; [66] introduces the collection) 的基因组已经产生了大量的学术研究,同时也长时间支撑了Nasonia的遗传学研究[67]。要充分认识到基因组学对寄生性膜翅目昆虫的潜力,还需要对其他科的物种进行比较研究。

社会性行为的机制和进化是膜翅目昆虫基因组研究的重点之一。具有复杂精细的社会性行为的针尾部包含多次产生真社会性的蚂蚁、蜜蜂和其他蜂类[68,69]。对这种合作生活方式的分子基础的了解是蜜蜂基因组初步测序的最令人期待的发现之一[4],而最近的比较基因组学方法将这些初步发现置于更广泛的系统遗传背景下[8,12,18]。比较学方法对了解膜翅目行为驱使导致惊人的社会生态位多样性的分子机制是非常有用的[70_,71]。基于20多个真社会性膜翅目昆虫的基因组进行的真社会性研究的一些见解如下:1)新基因和保守基因在社会地位表型调控中的重要性[19,72_]2)社会地位相关基因相对于其他基因似乎进化更快,这表明了是适应进化靶标基因[73,74]3)基因调控对真社会性昆虫的表型可塑性的重要性(例如: 基因网络结构的改变,表观遗传机制如DNA甲基化等) [13,18]

虽然大多数基因组研究都聚焦于在社会性进化,膜翅目昆虫同时也为研究包括母体关怀、社会性寄生、取食/捕食等行为以及昆虫发育等方面的分子基础的调查提供了许多机遇。一些研究的概念框架和预测工作都已完成就位(如:社会性寄生[75], 发育 [76–81]),其他反面也能通过其它分类类群已有的(概念框架和预测工作)基础进行加强改善(如:蛇毒液进化[82],食性转移的基因组基础[83,84])。

基因组学中未被充分代表的类群

由于膜翅目中主要科之间的巨大的遗传距离差异[85],选择合适的分类单元进行比较是一个巨大的挑战。膜翅目的冠群(Crown group)起源于250~300个百万年前,而且进化距离超过现代鸟类的3[1,85,86]。蜜蜂的共同祖先起源于约100个百万年年前,蜜蜂+蜜蜂总科与蚂蚁的分化发生在约1.45亿年前,近似于有袋动物与胎盘哺乳动物的分化时间(发生在1.6亿年前)。增加每一谱系分支上样本的数量以及谱系取样量会提供更高的分辨力来解析关键表型的基因组签名。此外,我们也认为一些特定的类群尤其适合一些额外的比较。

扩大膜翅目昆虫基因组的取样使得每个科能够拥有一个或多个基因组数据能够为未来该类群进化研究提供非常有用的框架。尽管近期在解析高层次系统发育关系研究已经取得了显著性的进展[85,88,89,90],但在总科级和科级水平仍存在着很大的不确定性(Figure 1),尤其对针尾部之外的类群。如果获取了所有97科的基因组数据将帮助我们解决系统发育研究中存在的普遍性问题,如数据量不足、不完全谱系分选(incomplete lineage sorting)、碱基组成偏向性、长枝吸引等。如果每个科内拥有多个被仔细挑选出的代表物种,这将会进一步减少取样量不足所造成的相关问题[85]。然而,对于大多数多物种的系统发育分析研究,使用全基因组仍然十分昂贵了,但是如果每个科至少拥有一个高质量的基因组数据的话,那么还是非常经济划算的[91,92]。在科级水平上对膜翅目昆虫基因组进行完整取样,也能更好地评估整个目内基因组大小变异和基因家族进化。对于后续发育生物学检验来说,被选择的物种应该包含可以用于基因表达检测与基因定位的胚胎学和不同幼虫阶段样本。

寄生蜂是一类高度多样化的类群并受到生物防治应用和进化生物学研究的青睐[93,94],然而目前仅公开发表了有5科的14种物种的基因组,其他约30个物种(包含另外一科)的基因组正在进行中。四个多胚发育的寄生蜂科之间的比较基因组学研究可能会提供对这种发育策略新的理解[80]。其中的两个代表性物种已完成测序(见表1M. cingulum(茧蜂科Braconidae)与 C. floridanum (跳小蜂科Encyrtidae))。未来将需要优先考虑至少一种来自广腹细蜂科和鳌峰科的多胚发育种类。我们同时建议每个寄生蜂科至少需要一种代表性物种,因为不同科寄生蜂在利用的寄主种类以及生物学都具有差异。了解寄生蜂的寄生专化性及克服寄主免疫性机制都需要大范围的取样。此外,还需要包括能够对共享寄主(如蝇属Drosophila)的寄生蜂种类进行比较的样本,并与寄主的基因组进行配对将有助于谱系间以及寄生蜂-寄主互作关系的比较研究。

增加胡蜂科、隧蜂科和蜜蜂科等关键类群的分类单元覆盖深度将有助于通过比较基因组学手段来了解真社会性的进化。这几个科中每一个科都有着多样化的社会性生活方式以及与之近缘的独栖性蜂类。在一些如胡蜂与木蜂(蜜蜂科:木蜂亚科)等关键的谱系内,就能够进行从独栖性到微弱的社会性行为到高度社会性完整系列的基因组比较研究[71]

尽管社会性蜂类一直都是理解社会性进化的模式谱系[96],但是类群中仅有两个已发表的基因组,并都隶属于马蜂属Polistes种类[8,18]。目前填补这些空白的项目,将会从基因组学的视角探究完整的社会性系列的进化[97]。隧蜂科中的sweat bee对于社会性进化的比较研究也非常有用。该科含有至少有两个独立起源的社会性种类,并且至少有12个谱系退化到独栖性生活方式[98–100]。此外,HalictusLasioglossumMegalopta等属内的一些种类的个体或者种群可以在独栖性和社会性生活之间进行转换。我们提议针对具有社会性行为变异的关键物种需要在适合系统发育尺度下进行密集取样,以提高我们对社会性进化的理解,提供行为对环境因素如纬度和海拔[101–103]、遗传影响[70]以及种群内的繁殖策略差异[104]等因素的响应机理的解释[104]

非社会性针尾部蜂类基因组资源的发展将会为社会性进化研究提供重要的基因组水平的背景知识,并且提供一些创新性行为如central place foraging(如筑巢)、母亲关怀及社会性寄生的基因组特征。特别有用的科包括蛛蜂(蛛蜂科Pompilidae)、蚁蜂(蚁蜂科Mutillidae)、细腰蜂(泥蜂科Sphecidae)以及cicada killers bee wolves(方头泥蜂科Crabronidae,有独立的社会性起源)。这些类群与胡蜂、蜜蜂十分近缘,并且在亲本关怀、食谱、寄生与毒液功能等方面展现了令人诧异的多样性。此外,由于针尾部蜂类(除蜜蜂科之外)的遍布世界范围并且较为引人注目,因此能够基于被详细描述的行为和自然历史信息进行基因组研究。

 

挑战

除基因组注释之外,膜翅目基因组在测序和组装方面也面临着巨大的挑战和困难,包括取样质量(sample quantity)、杂合性(heterozygosity)和可利用性;功能验证(functional interpretation);以及其他未知因素。由于缺少足够量的样本,使得获取小蜂总科高质量的DNA是非常困难的。虽然如此,美国国家自然科学基金已经资助了一个系统发育项目致力于从24294388个物种中获取高质量的DNA(与John M. Heraty教授的私人交流)。对于蜜蜂来说,可以从USDA-ARS-PWA Pollinating Insect Research Unit中的U.S. National Pollinating Insect Collection获取针插标本。并且,ARS科学家在北美地区采集的新鲜标本(近期采集并鉴定过的)并与研究北美分布的相关类群的专家进行合作,可以保障获取满足基因组层次的DNA质量。然而,一些可用的标本(包括许多寄生蜂)体型十分微小,仅能产生有限的DNA量。尽管,这些DNA的量能够满足前期的短序列片段建库准备的要求,对长片段测序技术来说则需要混合多个样本个体来提供足够量的DNA,个体间的杂合性则对最后序列的组装带来了挑战。理论来说,连续的多代近交能够解决上述问题,然而一些物种不能够进行近交(如:包括复杂性别决定机制的种类,纯合性导致死亡或不育的二倍体雄性)。就注释而言,在生物学中一些有趣的差异基因往往进化速度较快,这使得很难在基因功能注释完善的参考物种基因组中找到同源基因。因此,需要进行一些功能验证试验(如特异性表达和基因敲除和敲入)。这一点对表达性差异会影响生物学、远程操纵子/增强子以及表观遗传修饰等方面的差异尤其适用,并可能导致一些关键性状的差异(如:滞育在不同Nasonia vitripennis种群间的差异[105])。最后,新测序的膜翅目种类的基因组特性如巨大基因组,复杂结构以及高GC比都会降低基因组组装的质量。

 

完整的目录是可能的

尽管有许多策略可以预期未来膜翅目基因组,我们建议可以着重于宽度(Breadth)、生物学和多样性三个方面。随着基因组测序在在这个物种多样化的目中的覆盖宽度愈来愈宽将会带来长期的科学价值。我们提议对每一个科至少获取一个具有高质量的基因组(81个样本)。对于其中包含多于50个属或者100个种类的15个科,我们建议增加其中所有物种数的0.05%的样本(27个样本,表2)。对于一些具有特殊意义的科如传粉者和寄生蜂来说,我们提议增加42个物种,这样则需要优先物种基因组的数量为150个或者是总物种数的0.1%。现今这些优先基因组(Premier genome)主要使用了长片段测序,de-novo contig组装,long-range scaffolding (使用Hi-CBioNano Genomics)以及基于短片段测序提高基因组质量。这样获取的基因组相比于使用桑格测序或者短片段测序获得的基因组将会更加连续化、完整和准确。这样的基因组相比之前来说花费更少,但仍然十分昂贵,因此不大可能将所有的样本进行测序、组装获取基因组。较低成本的短片段装配体(Assemblies),具有高保真的短contigscaffold30x的比较基因组比对研究,可用于填补系统发育研究中近缘物种的抽样。其他有用的基因组数据类型已经产生(ENCODE)或提议(FAANG)用来注释其他动物。这些数据或至少转录组数据(具有高质量的long-reads数据)是提高低质量assemblies价值的非常有效的辅助手段。有了可用的样本、强大的技术和更可靠的方法,这是一项可行的任务,并可能在未来数年或持久性对许多研究领域产生重要影响。




http://blog.sciencenet.cn/blog-536560-1102159.html

上一篇:感恩宜兴湖㳇刘营春夫妇,兼记硕士生阶段野外工作
下一篇:Ladislav Bocák教授学术报告-20180305

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2019-12-15 21:35

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部