|
人类基因组中包含编码淀粉酶的基因的区域,对于淀粉消化至关重要,显示出广泛的结构多样性。在人类历史上,淀粉酶基因已经多次被复制和删除,而含有这些基因重复版本的结构在农业出现后被自然选择所青睐。
饮食是自然选择的重要驱动力。例如,大约10,000年前驯化产奶动物之后,一个使成年人能够消化牛奶的遗传变异在人类群体中传播。同样,大约12,000年前开始采用农业引发了各种人类群体向富含淀粉的饮食转变。
在人类中,淀粉的消化是由α-淀粉酶酶实现的,这些酶由淀粉酶位点(一个基因组区域)中的三个相邻基因编码。所有这三个基因在拷贝数上都有变化,更高的拷贝数与增加的消化淀粉能力相关联。然而,这些基因复制的结构和进化历史未知,仅通过测序短DNA片段或读取是无法评估的。使用人类泛基因组参考联盟(HPRC)生成的长读基因组组装,现在可以解析淀粉酶基因复制的结构多样性和选择性影响。
为了表征淀粉酶位点的复杂结构,我们检查了来自HPRC长读基础的基因组组装的近100个单倍型(从一位父母那里一起遗传下来的DNA片段)。使用这些序列,我们构建了一个“泛基因组图”:一个数学表示,代表这些单倍型中淀粉酶位点的遗传变异。然后,我们寻找在这些单倍型内部和之间共享的序列特征。我们识别出了28种不同的单倍型结构,每种都有不同的序列特征和淀粉酶基因拷贝的组合和配置。
接下来,我们使用包围结构可变淀粉酶位点的序列中的遗传标记构建了一个进化树。这棵树代表了单倍型之间的进化关系,使我们能够追踪和确定不同结构的出现时间。我们发现,相似甚至相同的结构在历史上出现了几次,不同的淀粉酶基因已经被反复复制和删除(图1a)。这种“反复进化”可能解释了之前使用短读数据在淀粉酶位点检测选择信号的挑战。
图1. 人类淀粉酶位点的进化历史。AMY1(1)、AMY2A(2A)和AMY2B(2B)基因编码分解淀粉的淀粉酶酶。在人类中,这些基因一起位于基因组中的淀粉酶位点。这个位点显示了广泛的结构变异,并包含了每个基因的不同数量的拷贝。a,展示了几个突变事件,这些事件产生了不同的结构单倍型(从一位父母那里一起遗传下来的DNA片段;以“H”开头的单倍型名称如图所示)。从上到下:最近的AMY2A基因复制;AMY2A基因的完全丢失;以及AMY2A和AMY2B基因的顺序和联合复制。蓝色、红色和橙色形状分别表示复制、删除和倒位事件。b,具有不同数量基因复制的单倍型(复制单倍型;蓝线)及其95%置信区间(阴影区域)的估计频率和选择系数(衡量携带者适应性差异的度量)的轨迹。虚线,随时间的平均选择系数(0.027);kyr bp,距今千年(以1950年为基准)。
最终,为了解决自然选择的问题,我们开发了一种方法来识别个体基因组中存在的结构,这些基因组是使用短读序列技术进行测序的。通过将这种方法应用于来自西欧亚地区古代人类遗骸(距今12,000至250年间)的基因组,我们发现含有更多基因复制的单倍型在过去12,000年里迅速增加。使用三种互补方法,我们发现这种频率增加最好解释为在西欧亚采纳农业后对淀粉酶基因高拷贝数的正向选择(图1b)。
研究意义
我们的发现强调了过去12,000年饮食和农业对人类进化的影响,并凸显了结构性变异作为自然选择所针对的关键遗传多样性来源的作用。它们进一步表明,长读、群体规模、单倍型解析的基因组组装和基于泛基因组的方法对于解析与适应相关的复杂基因组区域至关重要。
然而,我们的研究仅直接观察了大约100个单倍型(即近50个个体)的结构架构,这仅仅是全球人群遗传变异表面的一小部分。持续努力增加来自不同人群的长读基因组的代表性无疑将揭示淀粉酶位点及更广泛范围内的进一步结构多样性。
尽管来自西欧亚的古代人类基因组使我们能够探索这一世界地区的选择情况,但农业在人类历史上已被多次独立采用。生成其他古代人类遗骸的基因组将使人们能够进一步研究与这些农业起源替代方案相关的选择。此外,尽管不是我们研究的重点,但与人类共同生活的几种动物物种的基因组也显示出与作物驯化可能相关的较新的淀粉酶基因复制。未来的研究可能会揭示这些物种和人类之间在基因组结构和饮食转变上的相似之处。—— Joana L. Rocha 和 Runyang Nicolas Lou 位于美国加利福尼亚州伯克利的加利福尼亚大学。
审稿专家观点
作者使用泛基因组以前所未有的方式研究了人类群体中淀粉酶单倍型的多样性。这是一个重要的基因组区域,因为疾病关联证据线之间的冲突可能源于该位点的复杂性。作者建议,如果我们能理解那种复杂性,也许我们可以解决一些争议。—— Ryan Layer 位于美国科罗拉多州博尔德的科罗拉多大学。
论文背后故事
让我们最感惊讶的发现之一是,在过去的12,000年里,几乎相同的淀粉酶单倍型结构在人类中反复进化。在从结构可变区域两侧的序列构建进化树后,我们预期会发现相似结构在树中紧密聚集在一起。令人惊讶的是,这棵树与结构相关性很差,让我们感到困惑。然而,从可变区域两侧的序列生成的树产生了高度相似的结果。此外,我们发现在该位点上抑制了基因组重组,这种重组会“打乱”共同遗传的序列。综合这些证据指向了淀粉酶位点极高的结构变异率,意味着类似结构的多个独立起源。这一发现还有助于解释为什么在这个位点很难观察到选择的特征信号——它违反了许多传统选择扫描的主要假设。—— J.L.R 和 R.N.L.
《自然》编辑的看法
淀粉酶有助于淀粉消化,人们怀疑新石器时代的转变必须在人类这些酶的遗传位点留下选择的迹象。然而,到目前为止还没有发现这样的信号。现代人类基因组的长读序列和古代人类基因组的霰弹序列使得这项研究能够解析多样化的复杂结构单倍型,并且确实发现了在欧亚人中近期在人类淀粉酶位点的选择证据。—— Michelle Trenkmann,《自然》高级编辑。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-21 21:33
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社