||
整合现有基因组序列资料以揭示犬狂犬病毒在全球传播的规律(3)
(Integrating full and partial genome sequences to decipher the global spread of canine rabies virus)
法国巴斯德研究所等机构的Holtz等今年7月在国际权威科学杂志《自然通讯(Nature Communications)》发表研究论文(见参考文献),利用狂犬病毒基因组的全部和部分序列来分析历史上的狂犬病毒在国家之间的传播,产生了精确的年代测定和对其地理分布的可靠估计。
现分若干次译介此文,供国内关心犬狂犬病流行和控制的各界人士参考。
结果(1)
1. RABV(狂犬病毒)序列与元数据(metadata)的采集和组成
RABV基因组5个基因的全部25,787个可用序列从NCBI(National Center for Biotechnology Information,美国国立生物技术信息中心)病毒数据库中下载。经过质量控制筛选,RABV数据集减少到14,752个序列,涵盖121个国家,时间跨度从1972年至2020年,源自192个不同的宿主物种。多重序列比对(MSA,multiple sequence alignment )包括RABV基因组的5个基因的串联(concatenation)(图1a和附录表2)。
该MSA的最大似然(ML,maximum-likelihood)树(图3)揭示了三个主要的系统发生群( phylogenetic groups),其自举(bootstra)值大于0.95,分别对应于蝙蝠、臭鼬/浣熊和犬相关的RABV,与之前的全球RABV分析一致。该树的拓扑结构在空间上是由进化枝(clades)构成的,而基因的不同片段对序列聚类的影响非常小(图3:基因片段和简化的进化枝用不同颜色表示),说明序列不是按基因区域聚类的。所有10,209个与犬类相关的序列被提取出来,用于本项研究的其他部分。
图1:犬RABV序列的元数据归类。
(a)基因片段组成,(b)宿主物种组成,(c)来源国家组成,(d)不同大陆所收集的序列按基因片段的名称、宿主进行归类后随时间的演变,用堆叠条形图表示每年累积总数。宿主物种和基因片段的颜色定义见图a和图b。
犬科(Canis familiaris)和狐属(genus Vulpes)是犬类聚类序列最常见的来源,分别占51.9%和8.4%。其他科,包括牛科、人科、鼬科、猫科、臭鼬科和獴科,贡献了剩余的序列。样本所在的地理位置影响了序列的主要宿主来源,大多数欧洲的序列来自狐属(Vulpes),而亚洲和非洲的序列主要来自家养狗。在亚洲,人科和鼬科,特别是中国 台湾的鼬獾,是序列的主要来源(图1b, d)。
自20世纪70年代以来,几乎所有大陆都经历了向NCBI病毒数据库提交RABV序列的指数增长。这种增长在N基因和G基因中最为显著,而WGS(全基因组序列)的提交速度较慢,特别是在欧洲和亚洲(图1d)。WGS仍然只代表13%的序列和62%的国家。这证明了可用的部分序列多样性的数量很大,以及仅使用WGS进行系统发生研究时系统发生信号和分辨率的潜在损失很大。此外,根据研究所在的国家/大陆,研究会特别倾向于某些基因。例如,在比例上,欧洲主要对N基因进行测序,而亚洲对G、M和P基因的许多样本进行了测序。因此,只使用N基因或WGS会在任何系统地理分析中引入系统抽样偏差,会忽略了存在于基因组其他区域的序列。
(未完待续)
参考文献:
Holtz, A., Baele, G., Bourhy, H. et al. Integrating full and partial genome sequences to decipher the global spread of canine rabies virus. Nat Commun 14, 4247 (2023). https://doi.org/10.1038/s41467-023-39847-x
本博客相关文章:
整合现有基因组序列资料以揭示犬狂犬病毒在全球传播的规律(1) 2023-11-18
整合现有基因组序列资料以揭示犬狂犬病毒在全球传播的规律(2) 2023-11-20
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-25 01:47
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社