||
2011.7.8,美国太平洋生物公司demos实验室改进了对致命大肠杆菌测序的化学方法,将测序系统PlansQ4升级为RS
以下由莫妮卡-黑格报道:在上个月,当其它新一代测序商接连公布出致命型大肠杆菌Escherichia coli O104的测序序列数据时,太平洋生物公司一直保持着沉默。但是现在太平洋生物公司对包括致命型大肠杆菌菌株在内共12株菌序。进行了测序。
该公司声称,他们采用了一种改进的化学方法,对大肠杆菌菌株O104进行了完整的de novo测序组装,他们打算将这种方法整合进一个升级版系统PacBio RS,该系统将于第四季度公布出来。PacBio具体说明道:他们将平均测序读长提升到2900个碱基并结合circular consensus sequencing测序技术,可以获得一个准确度高达99.998%的de novo组装序列,测序前样品的准备时间将平均小于8小时/样。另外数据将会从公司的网站上公布,这项技术是继五月份发布的测序系统的又一大改进。客户在使用五月的系统时获得了平均读长为1500bp的测序序列.
PacBio是去年第一个对Haitian霍乱菌株进行测序的公司(IS 12/14/2010),但是却是各大测序公司中最后一个完成对致命大肠杆菌测序的公司,该菌株已被新测序设备如the Ion Torrent PGM 、 the Illumina MiSeq用作一种测序试验材料。
PacBio的首席科学家Eric Schadtz在Sequence上说,该公司一直忙于测序工作的商业化运作方面的启动,但是最终考虑到,对这株菌的测序,可能有利于最后的(组装,所以决定去测。该公司在今年春季的时候就研发了RS系统,并于5月份首先将两套设备(IS 5/3/2011)运送给早期的11个客户点。
随着大肠杆菌测序数据的发布,该公司证明了自该项目启动以来其在化学技术上取得重要改进。他们打算将在第四季度将这项技术整合到RS系统中。PacBio工作小组不但测了致命性大肠杆菌,还测了其它的11株大肠杆菌。其中的6株具有相同的血清型,但是在之前没有被测过。对于致命性大肠杆菌,研究者一共构建了两种测序文库:一个为片段较长的9kb插入文库,一个为circular consensus文库,对于9kb文库的测序可以达到2.9kb的平均读长,获得200倍覆盖度的测序数据。正因为更长的读长,数据产出量增加2倍,每个SMRTcell能够产生90Mb的数据。除此以外有5%的测序序列长度达到5.1Kb,最长的一个序列达到了22Kb。
Schadt在Sequence栏目上说:“长读长使得单靠PacBio的测序数据就能完成de novo的组装。希望能够在现有的覆盖度下,产生更多的超长reads,跨过产生的gap,从而在最大程度上获得一个完整的组装。长读长测序技术用来生成scaffolds,但因为是针对一个单分子的单通道测序,长读长测序相对与于短读长有更高的错误率。平均来说原始测序序列的准确率仅在85%左右。”研究小组又利用环化测序(circular consensus sequencing)来进行错误校正。Circular consensus 测序要求产生500bp大小的DNA片段,并将它们环化。
对于这样的环化文库,平均读长为430bp,每个环化片段平均测序六次,产生30倍覆盖度的测序数据。在利用长读长数据组装好scaffold之后,研究小组又利用环化测序得到数据进行比对校正,从而使测序的平均准确率达到97.8%。而最后组装完成的序列准确率达到了99.998%,其中包括33个覆盖细菌染色体的contig,和4个存与细菌两个质粒上的contig。Contig的N50大小为402kb,最长的一个contig有654kb。”
Schadt 说:“与此形成对照的是,Justin Johnson——EdgeBio 生物信息学主任,最近利用Ion Torrent PGM对菌株O104 测序所得数据进行组装,得到了173个contig,ContigN50大小为50kb,除此之外他还利用Illumina's MiSeq对该菌测序所得数据进行组装,结果得到117个contig,contigN50大小为95kb(7/5/2011),而其它研究组对致命型大肠杆菌测序组装时得到了相对较少的contig——例如英国健康保护局利用罗氏454 GS Junior测序得到的数据一共组装出13个contig,这些研究组都采用了参照引导的方法(reference-guided),通过构建fosimid文库,PCR测序获得片段两端的序列,来实现组装。”
Schadt说:“对与所测的其它11株菌,研究组只构建了长片段插入文库,然后将得到的reads比对到致命性大肠杆菌菌株所装配的序列上,进行比较基因组学分析。在这11株菌中,有六株与致命型菌株具有相同的血清型,但是,不含有志贺毒素。研究组对它们的序列数据进行进一步的分析,目标在于发现这些菌株间结构上发生的变化。对于这些参比菌株,特别是那六株与致命型大肠杆菌菌株具有相同血清型菌株的测序,将很有助于帮助理解致命型大肠杆菌菌株与相同血清型菌株之间存在的系统性差异有多大,这将从进化的角度阐明导致致命性大肠杆菌产生巨大毒性的关键作用因子。”
尽管所有的测序工作都是由PacBio公司来完成的,但是该公司仍然与一些研究组开展了必要的合作,其中包括马里兰大学的一个工作组,他们帮助组装对照菌株序列,进行比较基因组分析。马里兰大学基因组科学学院微生物系副教授,本次研究合作者之一, Dave Rasko说:“PacBio公司的长读长帮组解决了细菌基因组结构上的问题。例如通过de novo测序组装,帮助研究小组找到了编码志贺毒素的噬菌体插入到大肠菌基因组中的位置,本次序列组装的可靠性要更高,因为它是de novo测序,而不是基于参照进行的重测序。”
除此之外,引用错误率在某种程度上不真实的,尽管初始reads的错误率是比较高的,但是一旦加上环化测序结果,准确率将提高至99.99%以上,这使得这项测序技术不逊于任何其它测序技术。在此次大肠杆菌测序工作中没有使用PacBio公司的另一项测序技术strobe sequencing,该技术对单个DNA分子上的序列进行阶段性测序来帮助实现contig连接。Schadt说在本次测序中,因为读长足够长使得strobe sequencing测序技术没有必要使用。
当公司得到的序列长度很短时Strobe sequencing将会非常有用,但是现在为了更好的利用Strobe sequencing,我们将进行跨度为20kb的碱基缺口的跨越式测序。尽管 Strobe sequencing不能帮助序列的组装,但是它仍然有其它用处,例如它将有助于降低周转时间。”随着测序数据的公布,Amanda Murphy 的分析员William Blair发布了一个研究笔记,引用了PacBio公司所取一些研究进展,同时引用了投资银行的市场表现评级。她写道:“更长期的创新曲线,有赖于公司持续提高业务素质的能力”
Murphy同时补充道:“RS系统,在科研群体中的市场潜力巨大,令人振奋,特别是其长读长。但是因为其产出数据量较低——为Illumina's HiSeq 2000的1/70,所以其目前仍处在占据市场的时期,研究者需要长度长的应用在一些细菌测序和定位测序中可能采用RS系统。除此以外因为较短的运转周期,该系统在一些感染性疾病细菌(病毒)的鉴定和监测上可以被用上。”
Schadt 说:“感染性疾病是公司特别关注的一个领域,需要de novo测序组装和药理相关基因的目标捕获测序,长读长不但可以帮助识别微小的DNA变异,而且可以鉴定更大的结构变化,结构变化对于传染系统生物学研究是非常重要的。”除此以外他说他非常期待该机器在速度和灵活性上的优势,可以被用在目标基因测序领域,特别是对于癌症的诊断和治疗。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-29 20:58
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社