||
整合现有基因组序列资料以揭示犬狂犬病毒在全球传播的规律(5)
(Integrating full and partial genome sequences to decipher the global spread of canine rabies virus)
法国巴斯德研究所等机构的Holtz等今年7月在国际权威科学杂志《自然通讯(Nature Communications)》发表研究论文(见参考文献),利用狂犬病毒基因组的全部和部分序列来分析历史上的狂犬病毒在国家之间的传播,产生了精确的年代测定和对其地理分布的可靠估计。
现分若干次译介此文,供国内关心犬狂犬病流行和控制的各界人士参考。
结果(3)
3. 分段采样方法为系统发生分析和年代确定增强了信心(Subsampling method provides confidence in phylogenetic analysis and dating)
为了测试系统发生估值的置信度,我们对原始犬科动物狂犬病毒系统发生树的5个独特的复制序列数据集进行了区分国家的分段采样(subsampling),每个数据集有5,500个序列。为了确保使用FastTree(软件)高效但不太精确的方法对所有犬狂犬病毒进行系统发生分析的有效性,我们使用更精确的IQ-TREE2方法(即使用按基因片段划分的进化模型)进行了系统发生分析,并将所构建的树与通过三联体距离(triplet distance)、采用非分段采样的FastTree拓扑方法构建的树(其中0对应相同的树拓扑,1表示没有共同的三联体)进行了比较。
在5个分段样本(subsamples)和完整的系统发生树之间,IQ-TREE2基因划分和FastTree分析(标准化三组距离)之间只有0.60-0.64%的顶端三组(参见表3)存在差异。这验证了串联基因序列的快速方法的有效性,也进一步验证了分段采样确定年代的分子方法可在更大的进化树中推算出tMRCA(最近共同祖先年代)。我们发现分段取样获得的所有tMRCA(最近共同祖先年代)都非常精确(范围从1368到1375年),并且都位于整个犬科病毒系统发生树获得的tMRCA估值的95% CI范围,即在1301-1403年之内(参见表3,tMRCA)。
4. 纯化选择和多样化选择对RABV(狂犬病毒)系统发生树年代确定的影响不大( Purification and diversifying selection does not have a substantial impact on RABV tree dating)
为了研究选择压力对年代测定的影响,我们在HyPhy分析中使用了aBSREL、FEL和MEME方法,并在WGS(全基因组序列)分段采样树中测试了3,490个可变位点,其中2,793个位点存在纯化选择的证据,这其中的236个序列由Troupin等提供。我们还在24个位点发现了多样化选择的证据(p值 < 0.01)。
然而,值得注意的是,纯化选择和多样化选择的分枝(branch)长度估计并没有显著影响原始的系统发生树(置信区间有交叉)的分枝长度和对tMRCA(最近共同祖先年代)的估计(图4)。
5. 700年来由狗维持的狂犬病毒传播(700 Years of canine-maintained RABV spread)(1)
为了调查犬RABV(狂犬病毒)的地理传播,我们使用PastML 软件(https://github.com/amholtz/GlobalRabies/tree/main/data/ACR_Results)在完全和分段采样树上推断出国家级别的祖先位置。通过对分段采样树中所有序列的汇集,同时修剪(精减)整个犬病毒系统发生树,我们最终采用了6,096个序列得到一致性进化树。在对进化分支(clades )的祖先出现的年代进行估算时充分考虑集合的分段样本(subsample)和完整的系统发生树之间的一致,结果展示在图3。我们首次在一致的进化树中估算了44个已确定的犬相关病毒进化分支中的34个的来源国家,并对其祖先在内部节点的位置进行了估算,揭示了进化分支(clades )之间交互的历史传播(表4和图3)。
图3: 犬RABV(狂犬病毒)序列的一致的ML(最大似然)系统发生树(n = 6096)。
在大多数内部节点上提供了LSD2(年代的最小二乘测算法)的置信区间(Confidence intervals)。分支颜色和颜色条通过祖先特征重建(ACR)表示估计的祖先分支。未确定的分支用黑色表示(图例显示在树的下面)。如果空间足够,标注病毒分支的名称和各分支的tMRCA(最近共同祖先年代)。外部标签表示对该分支的祖先所在国家或地区的推断。家犬是该系统发生树上最主要的宿主物种。 除家犬狂犬病毒以外的大多数分支显示在系统发生树中分支定义明确的分枝区域。在进化支定义明确的节点(nodes)上显示了1,000次重复的自举(Bootstrap)支持(动物的剪影图像来自http://phylopic.org/,这些资料可以在CC0 1.0通用公共领域专用许可下重复使用)。
(未完待续)
参考文献:
Holtz, A., Baele, G., Bourhy, H. et al. Integrating full and partial genome sequences to decipher the global spread of canine rabies virus. Nat Commun 14, 4247 (2023). https://doi.org/10.1038/s41467-023-39847-x
本博客相关文章:
整合现有基因组序列资料以揭示犬狂犬病毒在全球传播的规律(1) 2023-11-18
整合现有基因组序列资料以揭示犬狂犬病毒在全球传播的规律(2) 2023-11-20
整合现有基因组序列资料以揭示犬狂犬病毒在全球传播的规律(3) 2023-11-23
整合现有基因组序列资料以揭示犬狂犬病毒在全球传播的规律(4) 2023-11-25
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-25 01:47
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社