||
3.操作流程
简要的表述一下上图测序的过程:
1) 测序文库的构建
准备基因组DNA---随机变短化为几百碱基或更短的小片段---两头加上特定的接头
若为转录组测序
RNA片段---反转录---cDNA----片段化----加街头
值得注意的是:我们这里片段的大小对于后面的数据分析有影响,可根据需要来选择。对于基因组测序来说,通常会选择几种不同的片段大小,以便在组装的时候获得更多的信息。
2) 锚定桥接
带接头的DNA片段---变性---与通道上的引物刑场桥状结构---便于后续扩增
3)预扩增
添加dNTP 和Taq 酶----固相桥式PCR 扩增---变性---释放出互补的单链--通过--不断循环---获得上百万条成簇分布的双链待测片段
4)单碱基延伸测序加入四种荧光标记的dNTP 、DNA 聚合酶以及接头引物进行扩增,在每一个测序簇延伸互补链时,每加入一个被荧光标记的dNTP就能释放出相对应的荧光,测序仪通过捕获荧光信号,并通过计算机软件将光信号转化为测序峰,从而获得待测片段的序列信息。
得出数据,实验组结束!
========================================华丽丽的分割线===============================
在得到测序数据后,主要要进行后续的数据处理和分析:
1.组装
在这我们组主要采取的是华大开发的SOAPdenovo+GapCloser来进行组装,它的中心思想是采取图论的手段来进行拼接的,具体可以看我对于SOAPdenovo介绍的相关博文。
SOAPdenovo all -s XXX.lib -K 25 -p 16 -o
output -d 1 -D 1 -M 3 -F
GapCloser -o gapcloser_output_file -b XXX.lib -a
output.scafSeq -p 25 -t 8
然后再进行Reference的Mapping等等后期一个过程,就不详细写了
最后得到组装后的序列,通常是很长得Scaffolds.
2.注释
对组装后得到的Scaffold进行全基因组基因注释,包括:
基因组组分分析;
编码基因预测;
重复序列注释;
Non-coding RNA基因注释;
Micro RNA基因注释;
tRNA基因注释;
假基因(Pseudogene)注释等.
附:常用到的编码基因用到的软件有:
Augustus: http://augustus.gobics.de/
Fgenesh: http://www.softberry.com/
Genemark: http://exon.biology.gatech.edu/
3.功能分析
对预测的基因进行功能(Gene Ontology,调控Motif,Pathway等)注释:
可以使用的软件有:InterproScan,SignalP,SMURF
4.计较基因组和进化分析
如快速进化(rapid evolution)分析,共线性分析(Synteny Block),基因家族分析等;
常用的进化树分析软件:
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-7-27 20:43
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社