fish2012的个人博客分享 http://blog.sciencenet.cn/u/fish2012

博文

关于基因组测序、拼接及其后续分析

已有 12551 次阅读 2012-8-16 14:55 |系统分类:科研笔记| 基因组, 分析, 拼接

1.样品的采集、DNA的提取、上机
 
这一部分就略去吧,体力+操作娴熟活,爆个小料,实验组的少堂兄刚和师姐去大理、丽江、临沧等好几个地方花费10天时间采回了一批样。。据说超累超累得活。。去之前还开玩笑说回来可能不认识他了。。或者极端情况是被野兽带走。。哈哈,可见样品的来之不易了吧?跳过。。此步骤过于血腥暴力。。不再展开:)

2.测序的原理
  我们组采用的是Illumina/Solexa测序,它的基本原理是边合成变测序。在Sanger等测序方法的基础上,通过技术创新,用不同颜色的荧光标记四种不同的dNTP,当DNA聚合酶合成互补链时,每添加一种dNTP就会释放出不同的荧光,根据捕捉的荧光信号并经过特定的计算机软件处理,从而获得待测DNA的序列信息。

3.操作流程




简要的表述一下上图测序的过程:

1)  测序文库的构建

准备基因组DNA---随机变短化为几百碱基或更短的小片段---两头加上特定的接头

若为转录组测序

RNA片段---反转录---cDNA----片段化----加街头

值得注意的是:我们这里片段的大小对于后面的数据分析有影响,可根据需要来选择。对于基因组测序来说,通常会选择几种不同的片段大小,以便在组装的时候获得更多的信息。

2)  锚定桥接

带接头的DNA片段---变性---与通道上的引物刑场桥状结构---便于后续扩增

3)预扩增  

添加dNTPTaq----固相桥式PCR 扩增---变性---释放出互补的单链--通过--不断循环---获得上百万条成簇分布的双链待测片段

4)单碱基延伸测序

    加入四种荧光标记的dNTPDNA 聚合酶以及接头引物进行扩增,在每一个测序簇延伸互补链时,每加入一个被荧光标记的dNTP就能释放出相对应的荧光,测序仪通过捕获荧光信号,并通过计算机软件将光信号转化为测序峰,从而获得待测片段的序列信息。

得出数据,实验组结束!

========================================华丽丽的分割线===============================

在得到测序数据后,主要要进行后续的数据处理和分析:

1.组装

  在这我们组主要采取的是华大开发的SOAPdenovo+GapCloser来进行组装,它的中心思想是采取图论的手段来进行拼接的,具体可以看我对于SOAPdenovo介绍的相关博文。

SOAPdenovo all -s XXX.lib -K 25 -p 16 -o output -d 1 -D 1 -M 3 -F

GapCloser -o gapcloser_output_file -b XXX.lib -a output.scafSeq -p 25 -t 8

然后再进行Reference的Mapping等等后期一个过程,就不详细写了

最后得到组装后的序列,通常是很长得Scaffolds.

2.注释
  对组装后得到的Scaffold进行全基因组基因注释包括:

  基因组组分分析;

  编码基因预测;

  重复序列注释;

  Non-coding RNA基因注释;

  Micro RNA基因注释;

  tRNA基因注释;

  假基因(Pseudogene)注释等

  附:常用到的编码基因用到的软件有:
  Augustus: http://augustus.gobics.de/
  Fgenesh: http://www.softberry.com/
  Genemark: http://exon.biology.gatech.edu/

3.功能分析
  对预测的基因进行功能(Gene Ontology,调控Motif,Pathway)注释:
  可以使用的软件有:InterproScan,SignalP,SMURF
 
4.计较基因组和进化分析

 
如快速进化(rapid evolution)分析,共线性分析(Synteny Block),基因家族分析等;

  常用的进化树分析软件:

  MEGA:http://www.megasoftware.net/



https://blog.sciencenet.cn/blog-713614-602803.html

上一篇:win7 一键GHOST
下一篇:Sequencing Glossary
收藏 IP: 159.226.149.*| 热度|

2 卢宏超 赵明

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-20 20:33

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部