|||
我发现懒惰真是人的劣根性,一些做之前感觉可有可无、做完又感觉振奋的事,在没有人催着的时候,很难有动力去完成。
还是源于记者朋友的约稿,在deadline之前,刷了一宿,写成了一篇小文,恬着脸拿出来给大家秀秀。
要是记者朋友再有需求的话,没准我会就着这个系列继续写下去。
基因组科学走马观花
之宏基因组学和微生物组
任鲁风
从一篇火爆的论文谈起
2013年4月10日,在《美国医学会杂志》(JAMA)上发表了一篇题为“利用不需培养的宏基因组学测序技术研究产志贺毒素大肠杆菌O104:H4爆发株”(A Culture-Independent Sequence-Based Metagenomics Approach to the Investigation of an Outbreak of Shiga-Toxigenic Escherichia coli O104:H4,http://jama.jamanetwork.com/article.aspx?articleid=1677374)的研究论文,引起了学界和社会的广泛关注。这篇论文中应用了一种称为“宏基因组学”的技术方法,不通过培养,直接从病人样品中检测分析其携带的病原微生物,甚至可以发现用常规方法难以检出的病原菌。由此,大家都开始关注一个共同的话题,是不是已经找到了一个能够解决突发传染病疫情病原鉴定的金刚钻呢?是不是我们以后再也不会面对当年SARS疫情时无的放矢的手足无措呢?
这个问题相对严谨的答案一般都会让大众摸不到头脑,无非是取得了如何如何的突破,但仍然存在着如何如何的局限,前景是如何如何的美好,道路又是如何如何的艰辛诸如此类。作为一名从事病原微生物研究和检测技术开发工作的科研人员,我觉得有必要卖弄一点自己浅薄的认识,帮助大家对这件事有个初步的了解。本人才疏学浅,文中可能存在疏漏不足之处,万望见谅,欢迎批评斧正。
病原检测技术的尴尬
众所周知,人类发生感染,白话说叫得了传染病,其根本原因都是被病原微生物侵入了人体器官或组织,直接或者间接造成对人体的伤害。这些微生物不仅仅是细菌,也包括了病毒和真菌,而世界上到底有多少种微生物,目前没有人能够明确这个数字,一个很不严谨的说法是,人类已知的微生物种类只占全部种类的1%,能够致病的微生物数目,也随着健康事业的发展,在不断地被发现,不断地扩大。
对病原微生物的发现和确证,是科学家和医生不懈追求的目标。经过了上百年的积累和进步,人类已经可以利用现有的技术手段在很短的时间内判断引起感染的病原种类,从而进行有针对性的干预或治疗。但是,这一过程有一个前提,现有的常规检测手段只能针对我们已知的病原微生物,对于未知病原,只能依靠一个长期、繁琐、严格的流程来进行判定。经典理论认为,明确一个新发现的微生物种类,两个必要条件是可分离培养和明确的血清学特征。目前仍有99%的未知微生物的原因,也是因为这99%难以用常规方法进行培养。至今,我们仍然缺乏对未知病原的发现手段,甚至对较为罕见的病原也同样缺乏快速有效的区别和鉴定能力。
绝大多数微生物都以核酸(DNA或RNA)作为遗传物质,而且微生物的基因也具有其明确的种属特征,因此对核酸进行检测分析逐渐成为了微生物检测的金标准。2003年SARS爆发,初期的形态学判断给病原鉴定带来了误导,时隔十年,今年的H7N9疫情,短短几天内就通过测序获得了病原的基因序列,判明了病原种类和来源。技术的进步给人类的生存发展带来了强大的保护作用,但这还远远不是终点,不断提升的需求促使不断的技术进步,如何更快、更准、更方便地判明病原微生物种类成为科学和技术的焦点问题所在。
下面言归正传,聊聊宏基因组学在这一焦点问题中可能的贡献。
宏基因组学的由来
“宏基因组学”一词由两个单元组成,“宏”具有规模大和全的意思,英文是meta这个字头,国内也有人翻译成“元”。宏基因组学(metagenomics)最早是在1998年由Handelsman等提出的,意思是指生境中全部微生物基因组的总和(the genomes of the total microbiota found in nature),如果追究其概念的话,应该追述到1991年Pace等提出的环境基因组学(environmental genomics)这一名称。科学家就喜欢这样引经据典,姑且不论到底是哪位天才最先创造这一概念的吧,总之宏基因组学研究的就是,拿到一个特定环境中所有微生物的核酸序列,分析这个环境中到底有哪些微生物存在,哪种微生物在这个环境中当老大,它们对这个环境以及相互之间有哪些交流和互动,这个环境有可能是大兴安岭的一块黑土,也可能是南极的一片浮冰,当然也可能是某个发热病人的一口痰。
宏基因组学乃至基因组学的研究手段基本上就是测序分析,这一学科的发展也得益于大规模测序技术的飞速进步。这里要稍微偏一下楼,提醒大家注意,我说的基因组学基本研究手段是测序,而不是说基因组学就是测序,这个问题在我的工作中经常遇到,甚至一些同行和专家都会认为测序就是基因组学,让我们这些拿基因组学当专业的苦孩子屡屡憋屈,虽然我的主要工作之一就是测序技术研发,但我仍然坚定信念的认为,基因组学是一门非常宏大的科学。
收回话题,宏基因组学研究的工作流程一般可以概括成,样品采集、核酸提取、大规模测序、数据比对检索分析、生物学功能分析等。大家应该能够注意到,整个工作流程中,并没有对真正的研究对象(目标微生物)进行分离、纯化和培养富集,也就是说,这一研究手段并不在乎样品中有何种微生物,也不在乎有多少,而是只要在样品中,就统统把核酸序列测定出来,然后再通过和已有的核酸序列数据进行比对,判断已知种类和对未知种类进行预测。
这样的研究方法有效的摒弃了此前对微生物的分析手段中对于可培养性的依赖。开头提到的论文中,正是采用这种方法对当年爆发的腹泻疫情中的样品进行分析,不仅仅得到了当时导致疫情的O104菌株序列信息,还发现了诸如肠道沙门氏菌等等的病原菌序列。这就证明了利用这一研究手段,可以不用采取成功率和效率低下的培养方法,就能获知病原的种类,对于感染性疾病的预防、控制、诊疗和预后都具有莫大的潜力。
这篇论文并非是首创性的工作,能够发表在让科学家们都很眼红的JAMA(SCI影响因子30分)上,与O104的政治性和敏感性也不失关系。此前也有很多学者将这种研究策略应用在新微生物物种的发现上,比如2005年Breitbart等在人血中发现新的指环病毒和2008年Feng等在人Merkel细胞癌中发现新的多瘤病毒。更早期针对环境样品进行研究中,海水和土壤中的微生物绝大多数都是未知物种。
当然,我们更加关心的是与人类健康相关的病原微生物,这应该是继人类基因组计划后的又一项浩大工程。
人类微生物组计划
一个不太科学的说法是人体内有两个基因组,一个是人本身的基因组,另一个则是出生后才进入人体的多达上千种的共生微生物的基因组总和,我们延续着“组学”的概念,将其称为微生物组(microbiome)。人类并不孤单,每个人体内都携带了大约100兆(10^14)个细菌,10倍于人体细胞。它们寄居在我们的内脏、皮肤、嘴巴和鼻子,以及我们的生殖系统中。它们对人体健康有着至关重要的作用,比如帮助消化食物、合成维生素等,同时还有一些可能导致疾病。
2007年底,美国国立卫生研究院(NIH)宣布将投入1亿1500万美元正式启动酝酿了两年之久的“人类微生物组计划”。由美国主导的,由多个欧盟国家及日本和中国等十几个国家参加的人类微生物组计划将使用新一代DNA测序仪进行人类微生物组DNA的测序工作,是人类基因组计划完成之后的一项规模更大的DNA测序计划,目标是通过绘制人体不同器官中微生物宏基因组图谱,解析微生物菌群结构变化对人类健康的影响。之后这一组织于2010年公布了首份人类微生物组计划研究报告,提及了178个与人类宿主有关的细菌基因组序列的最初分析。
大众一般对于这种偏专业性的描述兴趣不大,他们所关注的主要在于这些工作能为健康保障提供什么帮助。因此,宏基因组学也好,微生物组计划也罢,说到头还是要解决实际问题。前面主要提到的都是一些学术的问题,下面我们来谈一谈这些进展的现实意义。
前景和需要解决的问题
对于感染性疾病的诊疗,最关键的环节之一是明确病因。以我们目前的呼吸道微生物组研究方向而言,在呼吸道感染病原方面,已知的主要病原主要是8种细菌以及数十种病毒。在临床上可以通过血相判断病毒感染或细菌感染,但要确定是何种病毒或细菌则需要依靠特异性的检测手段,而且加之病原的耐药性特征,对检测手段就有更高的要求,这还不包括罕见或未知病原的因素。
常规的检测技术包括了定量PCR技术、基因芯片技术、酶联免疫技术、细菌生化检测技术,以及细菌培养技术等。这些技术面临着检测目标单一、耗时长、操作复杂、需多种技术相互印证、只能针对已知目标等缺陷,当遇到危急状况或爆发性新突发疫情时,现有技术手段就很难满足时效性和精确性的要求。宏基因组学技术则能够满足这样的需求,应用这一技术可以一次性发现所有病原的存在状况,同时直接通过核酸序列进行判别,具有其他技术不可比拟的准确性优势。如果能够将这样的诊断手段应用于临床实践,将极大提高对病原微生物的判明效率和准确率,以利于具有针对性的指导治疗,对于健康事业的发展具有重大的实践意义。我国传染病防控重大专项中对利用高通量测序技术鉴定新突发传染病病原已经在“十二五”期间做出了专项立项,由疾控中心承担的这一项目目标是在72小时内明确新突发传染病病原。由此可见,我国的相关研究工作并未居于人后。
前景是美好的,道路是艰辛的。诚如这篇论文中所言,这一技术的应用还面临着灵敏度、检测速度、操作性和经济性的瓶颈。宏基因组学研究中最麻烦的一点就是干扰数据的比例过高问题,80~90%的数据都是相对无用的,相当于大海捞针,需要从海量数据中挖掘少得可怜的有效数据。同时,整个分析过程包括了样品处理、核酸提取、建测序文库、高通量测序、数据分析等环节,检测速度和操作性目前还无法向基层应用进行普及,高通量测序的成本虽然以及大幅降低,当仍然难以进入普通医疗市场。这就为我们提出了新的应用性问题。
我们的项目组正在进行高通量测序技术进入临床诊疗的开发工作,采用的技术策略是将整个操作流程全自动化实现,利用具有专利技术的样品处理工艺,最大程度降低背景干扰,自动化操作可以有效实现标准化流程,降低人员要求,产出数据直接通过云计算中心进行标准化计算分析,直接将结果反馈至用户,从而满足灵敏度、速度和操作性问题。我们自主开发的国产化高通量测序系统,从设备到试剂的成本均远低于进口产品,具有进入基层临床应用的经济性能力。我们期待在不远的将来,能够在这一领域真正实现国际前沿水平的先进技术应用。
再次强调,只为科普,水平有限,错漏难免,欢迎指正。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-22 21:39
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社