woodcorpse的个人博客分享 http://blog.sciencenet.cn/u/woodcorpse

博文

宏基因组理论教程1宏基因组简介

已有 12785 次阅读 2018-8-23 22:33 |个人分类:培训|系统分类:科研笔记

之前分享的加拿大生信网出品的《宏基因组分析教程》,有1万多位朋友阅读,有近2000多小伙伴下载了课程PPT。

但不知有多少小伙伴真正仔细学习过。收藏是没有用的,只有真正多学几遍才有收获

对于英文原版教程,很多新人有看不懂,学不会的问题。宏基因组团队针对这套教程进了翻译,同时结合最近的研究进展对内容进行了更新,方便广大同行入门者学习。

教程大纲

  1. 简介-定义、方法和数据库
  2. 扩增子-微生物群落多样性
  3. PICRUSt-16S预测功能基因
  4. 宏基因组分类学-分类和分箱
  5. 宏基因组功能-数据库与通路
  6. 宏转录组-数据、分类学和功能
  7. 生物标记挖掘

同时我们还分享整套最新中文教程的PPT,方便大家学习、记录笔记和提取有用的素材。

想要获得整套课程PPT的小伙伴,只需分享本文至朋友圈,截图发送到公众号后台,即可获得下载链接。

image
课程视频原始链接:https://www.youtube.com/watch?v=s_MnbWohcBM&feature=youtu.be
image
理论7节,包括基础知识、扩增子、宏基因组、宏转录组和差异分析。
image
在本课程结束后,你要学会以上内容。

image
image
image
培养组学,如 法国马赛的Didier Raoult团队, 美国华盛大学(密苏里圣路易斯)Jeffrey I. Gordon, 国内军科院的杨瑞馥团队。
宏基因组热点,表观遗传也是热点,两者结合会有无限的宝藏。纽约西奈山医学院的房刚老师做这方面,两个NB,中山大学骆观证在6mA的研究也发表过Cell。
细菌特有的6mA可区分株,质粒的来源。这面方易汉博陈老师m6A的研究曾经发表在22分干细胞杂志封面,

image
image
image
image
人类肠道参考基因集是华大的作品,一作覃俊杰目前是谱元基因创始人,新三板上市公司。要注意肠道细菌细胞数量与人体相近。

image
image
弗雷德里克·桑格( 1918年8月13日-2013年11月19日),是一位英国生物化学家,曾经在1958年及1980年两度获得诺贝尔化学奖,是第四位两度获得诺贝尔奖,以及唯一获得两次化学奖的人。
Staden Package最早的序列分析工具箱。至今仍可用。
生于菲利宾,生信学家,创立了数据库和查询标准,创立了氨基酸字母缩写。极大的降低了数据存储量。
Margaret Dayhoff :计算生物学,建蛋白和核酸数据库标准,单字母缩写AA即它发明。
image
image
为什么我要提T4,PhiX噬菌体。它有什么应用?提示,在测序中的作用,尤其是扩增子领域。增加序列的多样性,保证序列的质量和产出。如Hiseq2500产出80G,需要混入25-33%的PhiX再测序。

image
终于有网络了,建立了数据库查询系统。
Walker, T.A. and N.R. Pace. (1983). 5.8S ribosomal RNA. Cell 33:320-322.
Stahl, D.A., D.J. Lane, G.J. Olsen, and N.R. Pace. (1984). The analysis of hydrothermal vent-associated symbionts by ribosomal RNA sequences. Science 224:409-411.发表了几十篇CNS,和JBC,己发表文章267篇。
当年测个序,建个树发CNS,但没有现有的数据和设备,应该比现在发CNS还要难。当年JBC和CNS区别并不大,结果现在变成了一个是千青+博导;另一个是博士是否可以毕业的差别。
image
毛细管电泳测序已经自动化,91年施密特完成了16S的克隆和测序;95年流感嗜血杆菌测序完成;98年乔·汉德尔斯曼是提出宏基因组概念,耶鲁大学分子学生物学和发育生物学教授,研究土壤中的微生物和昆虫的肠道。但从90年代早期开始,她同时投身于推动女性和少数群体参与科学的运动。Illumina成立,

综合90s年代定义为基因组元年,细菌基因组,也提出了宏基因组的概念。并致力于测序技术研究。

1999年提出了自动分析ITS来研究微生物多样性的方法 Automated approach for ribosomal intergenic spacer analysis of microbial diversity and its application to freshwater bacterial communities

image
以色列技术研究所的Oded Béjà,在海洋宏基因组中发现视紫质基因;EM,nature X 2
2001年出现Microbiome这个词,2011年Microbiome杂志成立。办成了一个连续3年9分的杂志,近期南土所褚老师发表了一篇;
加州大学,伯克利分校的环境科学政治管理部的Jill Banfield最早的宏基因组、宏转录组和宏蛋折组的研究
Pat Schloss 扩增子分析软件3巨头之一,帕特 施洛斯(n. (德)城堡;宫殿),Mothur作者(DOTUR定义OTU和SONS比较): University of Michigan in the Department of Microbiology & Immunology. http://www.schlosslab.org/papers/ ,发表论文90篇,共享PDF原文,投稿预印本、Github源代码、数据SRA链接(PRJ项目主页),以及Google Scholar页统计引用,2013年起分享代码近40篇文章。https://github.com/SchlossLab/Kozich_MiSeqSOP_AEM_2013

image
Jessica Green
照片来在其Ted演讲,俄勒冈州立大学, http://pages.uoregon.edu/green/ ,2012年ISME发表建筑环境中微生物,2014年手机个性微生物,教室微生物组,微生物组影响因素;有比较著名的Ted演示,我们被微生物包围,设计环境微生物组。Rob Knight原科罗拉多大学,现在加州圣地亚哥,https://knightlab.ucsd.edu/ ,详见最新综述,Nature综述:大佬手把手教你分析菌群数据

image
image
image
image
image
RNA无法确定物种组成相对比例 ,谁知道为什么?休眠的菌不表达或极少;不同菌丰度差异,同种菌不同个体差异,无法定量物种。

image
image
https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-016-0976-y ,metadata数据,生态数据同行不公开的较多,不清楚。PacBio有10%的错误率,不仅有测错,还可能有插入、缺失等。而Illumia平均千分之一,主要是置换错误,一般长度准确。
嵌合体与底物DNA量,PCR循环数等有关。

image
比对至 reference base,但不同引物差异极大,可比性不强。引物评估
同一条件即可。不同条件方法,DNA提取,保存方式等,可能造成假阳性

image
image
Human urge to classify

image
large-scale community-based critical assessment of protein function annotation  难定义覆盖度、准确度的界限

image
image
Silva是目前更新最快,最全的数据库,有很多小工具如引物评估;
Greengenes是目前使用最广泛,唯一支持全面功能注释的数据库。

image
image
国外还是离我们很遥远,网速很慢,网页都半天打不开,不太好用。

image
国外还是离我们很遥远,网速很慢,网页都半天打不开,不太好用。芝加哥阿贡实验室建立。优点是参考数据库齐全。

  • RefSeq - protein database, type organism, function, feature
  • GenBank - protein database, type organism, function, feature
  • IMG - protein database, type organism, function, feature
  • SEED - protein database, type organism, function, feature
  • TrEMBL - protein database, type organism, function, feature
  • SwissProt - protein database, type organism, function, feature
  • PATRIC - protein database, type organism, function, feature
  • KEGG - protein database, type organism, function, feature
  • eggNOG - protein database, type organism, function, feature
  • RDP - RNA database, type organism, function, feature
  • Greengenes - RNA database, type organism, function, feature
  • LSU - RNA database, type organism, function, feature
  • SSU - RNA database, type organism, function, feature
  • ITS - RNA database, type organism, function, feature
  • Subsystems - ontology database, type ontology only
  • NOG - ontology database, type ontology only
  • COG - ontology database, type ontology only
  • KO - ontology database, type ontology only

image
主要有人体各部分的16S和宏基因组数据,人体菌群地图;iHMP,关于功能,主要包括怀孕与早产,炎性肠病IBD,2型糖尿病,

image
通路数据库;抗生素抗药性数据库,整合蛋白数据库,

image
image

猜你喜欢

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外2000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。
image

学习扩增子、宏基因组科研思路和分析实战,关注“宏基因组”
image

image

点击阅读原文,跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA



https://blog.sciencenet.cn/blog-3334560-1130799.html

上一篇:iTOL美化进化树实战:标签、枝修饰,分组着色
下一篇:宏基因组理论教程2扩增子分析
收藏 IP: 47.74.56.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 11:08

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部