|||
上海交大 赵立平
2007年,在和营养所陈雁教授聊天时,他对我们做的肠道菌群工作表示出浓厚的兴趣。他告诉我,他们做了一个很有意思的小鼠试验,问我们要不要看看这些小鼠的菌群有什么特点,也许能有新的发现。原来,他的博士生小韩在研究一种高密度脂蛋白基因敲除鼠。这种敲除鼠天生缺乏高密度脂蛋白这种“好的胆固醇”,吃高脂饲料容易得动脉粥样硬化,他们新发现这些基因缺陷的小鼠天生就有点胰岛素抵抗,提示这个基因与糖尿病有关系。为了观察饮食和基因对健康的影响,他们把这种先天因基因缺陷有点不健康的小鼠与它们的基因没有缺陷的野生型对照,各分成2组,分别吃高脂饲料或者普通饲料,形成了很有意思的2种基因与2种饲料的组合:“好基因+好饲料”;“好基因+坏饲料”;“坏基因+好饲料”;“坏基因+坏饲料”。如果基因代表先天因素对健康的影响,饲料可以代表后天因素对健康的影响,它们的组合,可以看出基因和饲料谁对肥胖、糖尿病的贡献大。这样的实验组合也非常适合研究基因和饮食对肠道菌群的影响,当然,也可以观察肠道菌群与肥胖和糖尿病的关系,是个难的的实验材料。这个试验到我们聊天时已经做了快6个月了,就要收摊了,我赶紧让张晨虹去找小韩把小鼠的粪便样品采集齐全。
当时我们最拿手的实验工具只有DGGE指纹图技术。张晨虹很快就投入试验,做出了很漂亮的指纹图谱。张晨虹的脑袋瓜很灵,手脚也非常麻利,做试验又很专心。如果打电话找不到她,一准是在做试验,手机在抽屉里锁着呢。她还是个“夜猫子”,喜欢一个人通宵做试验。别的同学一周做一次指纹图分析,出2块胶,她可以连轴转,最高纪录,两台设备同时上,一天24小时做8块胶,至今未有人能破此记录。指纹图也做的非常漂亮,而且把主要的条带都割胶、克隆和测序,鉴定出每条带所代表细菌的分类地位。等她的DNA指纹图结果出来时,小韩那边的动物试验也收尾了,表型数据也给了我们。
看到各组小鼠的体重和胰岛素抵抗(代表小鼠的早期糖尿病症状)的数据时,我吃了一惊:胖得最厉害、胰岛素抵抗最严重的组合居然是”好基因+坏饲料”!一开始我们都感觉“坏基因+坏饲料”应该是病得最重的组合,没想到结果是这么出乎意料!再仔细看看进食量的数据,“好基因+坏饲料”的组合吃的高脂饲料的量比“坏基因+坏饲料”的组合要高出很多,相差大约30%吧,可能由于某种未知的原因,坏基因的动物不喜欢吃油腻的高脂饲料了。这个试验虽然规模不大,但告诉我们一个很重要的信息:动物不需要有基因缺陷就可以得严重的肥胖症和胰岛素抵抗,只要多吃高脂饲料就行了。
菌群会是一种什么状况呢?能用菌群的组成差别来解释患病程度的差别吗?
看看DGGE指纹图,结果很有意思:不管是敲除鼠还是野生型,带着同一种基因的小鼠,吃不同的饲料时,菌群结构出现很大的差别,所有的主要的条带都变了,吃高脂饲料的小鼠肠道里的优势菌与吃普通饲料的完全不一样。
为了能定量地比较小鼠菌群结构的差别,张晨虹又用一种叫末端限制性片段长度多态性分析(T-RFLP)的方法对这4组小鼠的菌群做了分析,由于这些数据是用毛细管电泳为核心的Sanger测序仪做的,因此,得到的数据比较方便做统计分析。在张梦晖的指导下,张晨虹做了主成份分析(PCA),结果很有意思:所有的动物的肠道菌群结构先按照饲料不同聚成2大类,大约菌群结构变异的56%可以用饲料的不同来解释;在普通饲料上,敲除鼠和野生型可以分开,大约12%的菌群结构变异可以用高密度脂蛋白基因的突变来解释;不过,在高脂饲料上,敲除鼠和野生型的菌群结构几乎混在一起,没有什么差别。这2种指纹图分析的结果告诉我们,饮食结构是决定肠道菌群结构的最重要的因素,其次才是基因。而且,基因造成的菌群结构的差别只在普通饲料上表现的比较明显,在高脂饲料上,几乎看不到基因的影响了。
这些结果显然很有意思,我在中法肠道元基因组合作项目交流会上做了报告,大家对这个结果都很感兴趣。
不过,DNA指纹图技术只能告诉我们肠道菌群整体结果的差别,对DGGE中的重要的条带进行割胶、测序虽然也能搞清楚它们代表什么细菌,但毕竟只能鉴定出有限的那么几十种,而且也把人累得要死要活的了。记得上海生物芯片中心的张庆华老师就常给我讲:立平,要想想办法,再不能用DGGE这样的“小米加步枪式”的方法研究菌群啦,否则什么都难以搞清楚!
我从瑞典回来以后,就让张晨虹和我们实验室负责建立新的分析技术的张晓君老师开始关注新一代测序技术在微生物群落结构分析中的应用。这个时候,好消息来了,赵国屏老师做执行主任的国家人类基因组南方中心新进来一台454测序仪,而且很快就投入运行,做基因组测序效果不错。我当时决定,用这个动物试验的样品把454测序技术进行菌群结构分析的方法在我们实验室建立起来,彻底告别“小米加步枪”的时代。
454测序技术一次可以测定几十万条DNA片段的序列,如果要用这个方法测定多个样品的菌群结构就需要把每个样品的DNA片段在序列上做唯一性标记,这就是所谓的DNA barcoding (DNA条形码技术)。最早发表这个技术思路的,是斯坦福大学医学院富尔实验室,他们与微生物系的同事合作,建立了在每一条需要测序的DNA片段两端加上独特的4个碱基的序列,作为样品的标记,然后把所有样品的DNA片段等量混合,在454测序仪里做一次测序的方法。测序结束后,可以利用DNA条码序列把每个DNA序列准确地分配到其所属的样品里,这样,每个样品就有几百乃至上千条序列了。这样做下来,虽然一次测序的成本比较高,但摊到每个样品费用在几百元,还是很合算的。要知道,我们那篇PNAS文章做了7名志愿者的Sanger测序的克隆文库分析,每个人做了超过1千条,一共花了20多万;当时如果用454做,花同样的经费,一次可以做至少300个样品。现在做,成本就更低了。甚至有人预测,DNA测序的成本最终会如此低廉,以至于测定序列的成本会低于储存这些序列的成本,到那时,人们不会储存DNA序列了,用完就把序列扔了,需要时,下一次再重测。当然,这是后话,暂且按下不表。
做这个工作,离不了生物信息的人才。计算机系的俞勇老师给我推荐了一名他的学生华蔚颖来我这里读硕士,经过一段时间适应,小华开始进入角色,可以在生物信息分析的软件收集、使用和修改上做工作了。我的学生曹又方是1998我在山西大学时从应用数学专业推荐到生物化学和分子生物学专业读硕士的,后来跟我到了交大。他应该是中国最早做生物信息的学生之一了,毕业论文发表在BMC Bioinformatics。小曹毕业后先留到农学院院长唐克轩的实验室工作,后来调到系统生物医学研究院管计算机平台。小曹带着华蔚颖,设计了DNA条码序列,以及从原始测序的序列开始,进行序列到样品的分配、质量控制和比对、做树、分类地位认定等等整个流程需要的软件和数据库。我们的原则是:除了用454测序仪读取序列这一步,所有流程要全部在自己实验室能做起来。
几个试验的样品凑在一起,第一个run测了差不多300个样品。为了检验这个方法的可靠性和重复性,包括了一些已知序列的样品,其中小鼠试验的样品又有一部分做了3次重复。张晨虹和华蔚颖经过磕磕碰碰的努力,终于拿到了OTU的分布数据,也就是说,按照序列差异不超过3%归并成一个“种”(OTU)的话,一共得到516种细菌在所有小鼠中的丰度分布的数据。
有了这个数据矩阵,张梦晖指导张晨虹,尝试着用各种多变量统计方法观察各组之间的差别。首先,用Rob Knight等人发明的UniFrac方法观察了数据的自然结构,结果显示,饮食的确是影响菌群结构的最重要的因素。然后,用PLS-DA进行分类建模,试着用菌群组成的数据预报一只小鼠吃什么饲料?有没有基因突变?是不是健康(有没有胰岛素抵抗)?经过留一交叉法检验,模型是可靠的,预报的准确率也比较高,然后又用一些统计方法把对分类贡献大的菌群种类挑选出来。 我们用挑选出来的关键细菌种类的数据做同样的模型,结果与用516个变量的一样好,说明对分类真正有贡献的变量被挑出来了。 我们一共找到61种细菌,它们在饲料、基因或者健康状况发生变化时会相应地改变自己在肠道里的丰度,而其他的细菌的变化则与我们感兴趣的这几个变量没有什么关联。这是一个数据降维、降噪的过程。也是从一片混沌的数据里找到有意义的规律的过程。
当我们把这61个关键细菌在每只小鼠中的丰度做成热图后,可以看出一些很有意思的现象。首先,在整个菌群中占的比例最大的是一个叫做丹毒菌科的“科”。属于这个科的关键变量又分成M1-4共4个组,M1组在健康肠道里很多,可以占到总菌量的20%左右,不过,只要动物有了胰岛素抵抗(不管是基因突变引起的,还是高脂饲料引起的,也不一定要伴随有肥胖),这类菌的数量就降到1%以下;M3在吃普通饲料的小鼠肠道里可以占到总菌量的40%以上,在吃高脂饲料的肠道里会降到1%以下;M2和M4则只在吃高脂饲料的肠道里特别多。M2、3、4的丰度变化只与饲料类型有关,与基因是否突变和动物是否健康都没有关系。因此,肠道里占大多数的细菌的数量波动可能只与吃什么有关系,与健康关系不大。假如直接去测整个菌群的序列,发现的基因大部分恐怕与健康关系不大,反而会干扰我们找到与健康真正有关系的细菌和它们的基因。
2008年,戈登实验室发表一篇小鼠的论文,主要是通过转换饮食,先喂高糖、高脂的西方膳食,肥胖以后,再改成普通饲料,连续采样,观察菌群的变化规律。他们发现厚壁菌门里有一个纲的细菌在吃西方膳食肥胖以后数量增加的特别高。他们也测定了一个来自于人的肠道的属于这个纲的细菌的基因组,发现有很多基因与利用碳水化合物有关系。因此,他们推测,这个在他们论文里叫做柔膜菌纲的细菌类型在肠道里增加以后,可能会促进消化吸收各类膳食纤维,增加动物对热量的吸收,从而促进肥胖的发生。这个工作是第一次看到厚壁菌门在肥胖动物肠道里的升高不是整个门的细菌的行为,而是其中一个纲的升高造成的。
对比一下序列,就会发现,戈登实验室论文中的柔膜菌纲其实就是我们这个工作中发现的丹毒菌纲。所谓柔膜菌纲,是因为这个纲里有一些细菌是没有细胞壁的。不过,后来把没有细胞壁的类型移到了另外一个门,剩下的组成了丹毒菌纲。我们发现在小鼠肠道里丰度最高的是这个纲的一个科叫丹毒菌科。由于细菌的分类地位常常会发生调整和变动,咋一看,读者还以为我们看到的丰度最高的细菌与戈登实验室看到的是不同的东西,其实它们是同一类东西,只不过叫的名字有了变化,戈登实验室在发表时没有及时用新的名称而已。
与戈登实验室认为肥胖动物的肠道菌群是整个柔膜菌纲(丹毒菌纲)的丰度在升高不同的是,我们看到这个纲的丹毒菌这一个科才是真正丰度最高的类型,而且,在同一个科里的关系很近的细菌,依然对健康和饲料的变化表现出不同的反应。这就提示我们,研究肠道菌群与动物健康的关系,以及想了解什么样的因素会影响肠道菌群的组成进而影响动物和人体的健康,就不能在“门”这样的分类单元上进行,要细分到“科”以下的单元,以“属”和“种”为单位才行。
在我们的这次试验里找到的61个关键细菌里,还发现双歧杆菌在饲喂高脂饲料6个月后,无论动物是什么基因型,都检测不到了。可能长期的高脂饲料不能给需要膳食纤维的双歧杆菌提供营养,最后造成这类菌生长速度低于排空的速度,最后就被淘汰光了。更有意思的是:我们发现脱硫弧菌科里有一个菌,在病得最重的“好基因+坏饲料”的组合里,丰度最高,是“好基因+好饲料”组合的7倍还要多。
大量研究报道,双歧杆菌对肠道屏障有保护作用。这类菌如果被排空了,动物肠道的通透性可能就会升高,也就是说:肠子开始有点漏了,肠道里的乱七八糟的毒素就容易进入血液。脱硫弧菌科里的细菌是所谓的“硫酸盐还原菌”,它们可以把硫酸盐还原成有致癌活性和腐蚀性的硫化氢,另外,这些菌是条件致病菌,它们的细胞壁上的脂多糖具有很强的内毒素活性,进入血液可以诱发炎症。因此,双歧杆菌的减少乃至被排空、条件致病菌的丰度上升,可能会造成肠屏障功能下降、内毒素进入血液而诱发慢性炎症、推动代谢损伤的发展。这个推论与喀尼等人发表的系列论文是呼应的。所不同的是,我们把目光聚焦到了一些具体的细菌类型上。为下一步的深入研究,确认它们的功能,指明了方向。
这个工作可以说有很多与前人不一样的发现,但这些发现都“make sense”,可以与前人发表的结果有一个整体的呼应。可以看出,我们的工作是更多地在沿着喀尼等人指出的“代谢性内毒素血症”的方向前进的,而对戈登实验室的F/P比值与肥胖的关系是有挑战和质疑的。
这个工作写成论文以后,投了多家杂志都被拒稿,主要是审稿人中有不分青红皂白就一口否定的,怎么讲道理都不行,他就是不信我们的结果,或者,他认为这个问题已经有结论了,我们的发现没有新颖性,其实他根本就不看我们的结果与已经发表的主流看法差距很大,不是一回事。这篇稿子从PloS Biology审稿3个月退稿,到Journal of Molecular Medicine审稿2个月退稿,到Gastroenterology审稿两个月退稿,一连串的退稿让张晨虹很是郁闷,在我的鼓励下,她打起精神,又把稿子投给我们微生物生态学领域的最好的ISME Journal。这回的待遇好多了,一审评价整体不错,也提了不少意见,编辑同意修改以后再投回去。我们做了非常仔细的修改,写了很长的信给编辑,逐条解释回答审稿人的意见和我们的回应以及修改。论文再次投回去以后,过不久就被接受了。
论文发表以后,反响还不错,记得有一次开会见到了德国著名的微生物生态学家司马拉教授,她第一句话就是“Liping, I enjoyed reading your new paper! Its so interesting!”。这些话,是对一个科学家和他的学生们工作的最好的奖赏!
我们的论文发表前后,有不少在人群和动物中的工作发表,指出无法重复戈登实验室F/P比值与肥胖关系的结果,甚至得出相反的结果。当然,也有不少论文报道了与戈登实验室发现一致的结果。还有不少实验室甚至发展测定F/P比值的方法,用于肥胖与菌群关系的研究。
这个争论可能还要持续好多年。支持还是不支持F/P比值与肥胖的关系几乎成了肥胖与菌群关系研究领域一个“站队”的标志。我以很平常的心态对待这个争论,戈登教授本人也很平和。我始终认为,戈登教授对肥胖和菌群关系的研究的贡献具有划时代的意义。至于F/P比值,我认为他肯定是当时限于技术和经验,结论下的有点早了,不够确切,被后来的研究逐步修正是不可避免的,但这并不能丝毫损伤他的贡献的意义。我所有的文章和报告里,都对戈登教授的工作给予恰当的评价和肯定。2010年9月在圣路易斯召开的人类微生物组会议上,我和戈登教授第一次见面。我们两个人的报告被安排在一个主题里。他讲完以后,坐在第一排听我讲。我讲完下来后,他第一个站起来,走过来与我握手,并说:I am admirer of your work. 我也赶紧说:I am your fan!然后,两人会心的相视一笑。
F/P比值与肥胖有关系的结论发表在Nature上,其影响力是很深远的。特别是没有微生物背景的医学领域的同行,如果想进入菌群与肥胖关系研究领域,往往第一步先从分析F/P比值开始。这个工作是人类探寻什么样的菌群组成特征与肥胖有关系,而且希望是因果关系的最早的努力!不过,把菌群与肥胖的关系定位到两个门的比值以后,就使很多人,包括戈登实验室放弃了寻找对肥胖发生贡献大的具体细菌种类的努力,这是非常可惜的。如果要继续沿着F/P比值的发现继续深入研究的话,就要发现戈登教授在他们的Nature论文里讲的“一个门里所细菌共有的与肥胖有关的功能”,可惜,这个功能如果不存在的话,一个学生再努力都是白搭。2012年11月,我参加美国微生物学会的有益微生物学术会议,并做了大会开幕式报告。报告结束后,戈登教授的一个博士生来找我聊天,她告诉我,她现在是他们实验室唯一一个做肥胖的博士生了。为什么会这样呢?我想有不少原因,其中一个是他们实验室关于肥胖的结果已经在 2006年同一期Nature发表了2篇论文,后面的学生要想超越这个高度是很难的;另外,F/P比值与肥胖的关系如果不存在,当然会让后面的学生无法深入下去研究其机理。凡此种种,出现后面的学生不愿意做肥胖的局面,也就可以理解了。
(这篇研究饮食和基因互作对肠道菌群结构影响及其与代谢综合征发生关系的论文2009年10月在线发表,到2012年12月29日是ISMEJ网站被下载最多的10篇论文的第5名。感兴趣者欢迎到这里免费下载原文:
http://www.nature.com/ismej/topten/index.html)
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-22 14:11
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社