woodcorpse的个人博客分享 http://blog.sciencenet.cn/u/woodcorpse

博文

一作解读:EID-2017-宏基因组测序在新发腹泻病毒鉴定中的应用

已有 3015 次阅读 2019-1-29 17:49 |个人分类:读文献|系统分类:科研笔记

[TOC]

宏基因组测序在新发腹泻病毒鉴定中的应用

撰文:李杰 常熟理工学院生物与食品工程学院
责编:刘永鑫 中科院遗传发育所

写在前面

发现和鉴定新病毒以及确定新病毒与疾病的关系是预防、诊断和治疗新发病毒性传染病的首要任务。高通量测序技术突破了传统技术方法的局限,可以直接以标本中所有的遗传物质为研究对象,从而能够快速地鉴定出标本中存在的病毒,形成了一门研究特定环境中病毒群落的新兴学科:病毒宏基因组学(宏病毒组)

传统意义上有很多用于发现新病毒的方法,如病毒分离、核酸检验、血清学试验等,但它们都有一定的局限性。但利用高通量测序发现新病毒具有信息量大、对标本所含信息无偏倚、操作较简单、检测成本较低等独特优点,使得该技术已成为目前病毒发现中最为重要的技术之一,其在病毒诊断、溯源、预警等方面具有实用意义。本文以2017年发表在《Emerging Infectious Diseases 》(IF 7.42 )上的一篇文章为例来做简单介绍。

背景

2010年入冬以来,猪流行性腹泻病毒(PEDV)变异株开始在我国流行,并导致全国范围内的严重爆发,初生仔猪感染后死亡率达90%以上; 随后,可导致仔猪腹泻的新型肠道冠状病毒Delta冠状病毒(PDCoV)也被发现;冠状病毒的高变异特性目前已经成为仔猪腹泻防控的难点,给养猪业造成巨大经济损失,对养猪业的发展形成严重威胁。2017年初开始,广东部分猪场先后暴发免疫猪群新生仔猪腹泻、死亡的案例,临床发病比PEDV稍晚、死亡率稍低,实验室检测排除了常见的几种猪腹泻相关病毒感染。

研究方法

病料收集与反饲

采集来自三个猪场的32头生病仔猪排泄物用于检测常规的猪腹泻相关病毒和进行反饲实验。将20头5日龄仔猪分为四组,每组五头,其中三组实验组分别饲喂采集自三个猪场的病猪排泄物,每头饲喂5ml排泄物,一组作为对照。在接种后三天和五天每组分别剖杀2头猪进行尸检。

文库构建

将剖杀仔猪的小肠及肠道内容物制成匀浆并进行过滤,取上清用于RNA提取。提取的RNA在进行去除DNA和核糖体RNA后,通过体外随机引物反转录进行建库,测序在Illumina HiSeq平台进行。

image

图1 基于鸟枪法的宏转录组测序流程示意图

(A)样本收集

(B)样本的初步处理

(C)标本核酸的提取

(D)测序文库的构建

(E)高通量测序

(F)测序序列的信息分析

基因组组装

首先对测序获得的150 bp长度的双端测序序列进行质量控制后,利用短序列比对软件bwa将其比对到宿主参考基因组(susScr3)上,将未匹配的序列筛选出来。再利用wgs-assembler软件将未匹配的序列进行基因组拼接,产生unitigs。随后挑选组成序列数目较多的unitigs提交到NCBI进行blast序列匹配,寻找出潜在亲缘关系较近的可参考基因组,以其为参照将序列匹配到基因组上。最后利用samtools和bcftools将匹配信息生成为最终病原的基因组序列。

image

图2 基于宏转录组测序鉴定病原及基因组组装流程

基因组注释

获得的病毒全基因组序列通过在ORF finder网站(https://www.ncbi.nlm.nih.gov/orffinder/) 进行在线的开放阅读框预测,查找潜在的蛋白编码片段。我们设定最小的开放阅读框大小为150 bp,并忽略嵌套存在的开放阅读框,其他为默认参数设置。

研究结果

使用二代测序数据质量质控软件cutadapt 1.9.1对测序原始数据去除接头以及低质量序列等,得到后续可用序列170,654,027条干净数据,平均读长为125 bp,Q20以上的数据比例为96%左右。其中99.5%的序列通过短序列比对软件bwa可以比对到猪的参考基因组susScr3上

将不能匹配到宿主基因组上的0.5%的序列筛选出来,其中相当一部分可能是疑似病原的序列。我们将这些序列利用wgs-assembler软件进行拼接,共获得了131,070个拼接片段。借助在线的BLAST分析,发现其中一部分拼接片段(3%左右)与HKU2病毒相似性较高。我们以HKU2/GD/430/2006株的基因组作为参考基因组(Lau et al. 2007),将序列进行匹配,最终可以有效覆盖基因组的98.3%,覆盖度为1051X。利用samtools软件我们生成了初始的疑似病原基因组序列。目前该全基因组序列已经提交到NCBI数据库(MF167434),我们将该病毒命名为猪肠道Alpha冠状病毒(PEAV)。在不计算其3’末端多聚腺苷酸尾巴的情况下,其全长为27,171 nt。

通过ORF finder软件对PEAV基因组进行开放阅读框预测,发现了10个可能的阅读框,包括ORF1a, ORF1b, S, E, M, N, NS3, NS7a等(图3)。其注释的ORF信息与HKU2比较类似,除了ORF3和ORF10外。共有的开放阅读框序列的核苷酸相似性为80%到98%,氨基酸相似性为87%到100%。

image

图3 PEAV基因组结构示意图

PEAV的结构蛋白与HKU2有比较好的序列相似性。其中S蛋白的相似性较低,核苷酸相似性只有80%,氨基酸相似性有87%。而其他的结构蛋白相似性比较高,核苷酸相似性有93%~98%,氨基酸相似性有94%~100%。非结构蛋白的相似性略低,其中NS3和NS7a的核苷酸相似性为89%~90%,氨基酸相似性为89%~94%。

Reference

  1. Lang Gong, Jie Li, Qingfeng Zhou, Zhichao Xu, Li Chen, Yun Zhang, Chunyi Xue, Zhifen Wen, Yongchang Cao. A New Bat-HKU2–like Coronavirus in Swine, China, 2017. Emerging Infectious Diseases, 2017, 23(9): 1607-1609
    https://wwwnc.cdc.gov/eid/article/23/9/17-0915_article PDF: https://wwwnc.cdc.gov/eid/article/23/9/pdfs/17-0915.pdf

作者简介

李杰,中山大学生物信息学博士、博士后,现任职常熟理工学院生物与食品工程学院讲师。研究领域涉及微生物基因组组装、宏基因组学、畜禽流行性疾病的流行病学、病毒与宿主相互作用、病毒遗传演化、新发病毒的分离与鉴定等。目前主持苏州市科技项目和江苏省自然科学基金青年项目各一项,获得广东省“扬帆计划”博士后扶持项目两项,参与国家自然科学基金青年项目一项。参与发表SCI论文15篇,其中第一/共同第一作者8篇。

猜你喜欢

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。
image

学习扩增子、宏基因组科研思路和分析实战,关注“宏基因组”
image

image

点击阅读原文,跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA



https://blog.sciencenet.cn/blog-3334560-1159763.html

上一篇:QIIME 2用户文档. 17序列双端合并read-joining(2018.11)
下一篇:QIIME 2用户文档. 18使用q2-vsearch聚类OTUs(2018.11)
收藏 IP: 210.75.224.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 22:29

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部