Kevin2015的个人博客分享 http://blog.sciencenet.cn/u/Kevin2015

博文

chip-seq 数据前期处理

已有 4910 次阅读 2016-5-11 11:41 |个人分类:转载|系统分类:科研笔记

2016-5月根据课题需要自学chip-seq分析流程及思路,整理如下:

几篇别人整理的资料:

http://www.plob.org/2012/09/29/3760.html

http://www.plob.org/2012/01/09/1605.html

http://www.plob.org/2012/01/08/1538.html

http://www.bio-info-trainee.com/672.html

参考文献:

Park,P.J. ChIP-seq: advantages and challenges of a maturing technology. Nat RevGenet 10, 669-680 (2009).

Pepke, S., Wold, B. & Mortazavi, A. Computation forChIP-seq and RNA-seq studies. Nat Methods 6, S22-32 (2009).

Kharchenko, P.V., Tolstorukov, M.Y. & Park, P.J. Design andanalysis of ChIP-seq experiments for DNA-binding proteins. Nature biotechnology26, 1351-1359 (2008).

MACS (2.1.0)

简介

ChIP-Seq:用于在全基因组范围中研究DNA结合蛋白(相互反应)、组蛋白修饰(表观遗传标记)和核小体的技术,研究这三个主题可有助于了解基因之间的相互调控以及染色体的功能结构。

ChIP-Seq实验原理:示意图为Fig.1Fig.2. 在生理状态下,把细胞内的DNA与蛋白质交联(Crosslink)后裂解细胞,分离染色体,通过超声或酶处理将染色质随机切割,利用抗原抗体的特异性识别反应,将与目的蛋白相结合的DNA片段沉淀下来,再通过反交联(Reverse crosslink)释放结合蛋白的DNA片段,最后测序获得DNA片段的序列。

注意:当研究重点是得到核小体的位置和组蛋白修饰的位置的时候,实验中并不首先进行crosslink,而是用超声或者MNase直接进行打断,优先使用MNase,可以更高效地去除掉linker DNA片段以得到核小体更为精确的位置。

说明:9DD7C11FC548B7FC87297D3B66B25ED501FDF08D7D8E_500_628

摘抄自(http://www.plob.org/2012/09/29/3760.html

数据分析细节

peak calling

1) 染色体上信号波形的定义;

2) 建立背景校正模型;

3) 建立搜索peaks的准则,即建立判断怎样可以是一个peak(一般会用到背景校正模型中的背景值);

4) 校正模型,过滤掉假阳性的peaks;

5) 给找到的peaks排序,给出显著度。

说明:http://upload.plob.ybzhao.com/wp-content/uploads/2012/09/C59D9143E91CA6ED15485810F18A63E69198D68D7D8E_500_649.jpg

数据分析流程(摘抄自生信菜鸟团):

5.5G Apr 30 10:31Xu_WT_rep2_BAF155.fastq

18G Feb 13 20:37Xu_WT_rep2_Input.fastq

前期处理:

for id in *fastqdo echo $id; perl DynamicTrim.pl $id; done

for id in*.trimmed; do echo $id; perl LengthSort.pl $id;done

bowtie比对:

samtools faidxhg19.fa

Bowtie2-buildhg19.fa hg19

for i in *single;do bowtie2 -x pathway/hg19 -U $i -S $i.sam; samtools view -bS $i.sam> $i.bam;done

接下来利用MACS2软件检索峰:

1.安装: pip install MACS2 or python setup.py install --prefix /home/taoliu/

2. 设置环境变量:

把export PYTHONPATH=/home/taoliu/lib/python2.7/site-packages:$PYTHONPATH  写到 ~/.bashrc 里面export PATH=/home/taoliu/bin:$PATH3. 运行程序Example for regular peak calling:     macs2 callpeak -t ChIP.bam -c Control.bam -f BAM -g hs -n test -B -q 0.01 Example for broad peak calling:       macs2 callpeak -t ChIP.bam -c Control.bam --broad -g hs --broad-cutoff 0.1 参数理解见:https://github.com/taoliu/MACS




https://blog.sciencenet.cn/blog-2609994-976469.html

上一篇:AW Pipeline for allele analysis
下一篇:chip-seq 数据分析下游1--Rcade
收藏 IP: 220.163.147.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-9-2 08:20

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部