ChengyangWang的个人博客分享 http://blog.sciencenet.cn/u/ChengyangWang

博文

ChIP-seq和RNA-seq整合分析,BETA最擅长

已有 12694 次阅读 2017-12-18 15:36 |个人分类:Chip-seq、ATAC-seq实验分析|系统分类:科研笔记| Chip-seq, ATAC-seq实验分析


本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome

作者:小哈   来源:嘉因

用自己的双手,分析自己的数据?

文末有完美解决方案




用BETA能get到哪些生物学特征?


  1. 预测转录因子的功能是激活还是抑制;

  2. 识别转录因子的靶基因;

  3. 鉴定转录因子motif及其collaborator。



输入文件长啥样?


BETA Basic和BETA plus需要2个输入文件。输入文件一,TF结合位点,即peak的位置;输入文件二,敲降或敲除或过表达或激活TF后所有基因的变化倍数和P值。

BETA Basic能预测转录因子的激活/抑制功能,并识别靶基因;

BETA plus除了Basic的两个功能外,还能鉴定转录因子motif及其collaborator。


如果只有ChIP数据,没有基因表达数据,还有BETA minus可以用,它能根据ChIP数据算出TF对靶基因的调控潜力。

BETA minus只需要1个输入文件,即输入文件一,peak所在的位置


输入文件一

ChIP-seq的peak所在的染色体、start、end三列;

或MACS的输出文件*peak.bed

ChIP-chip的peak也可以作为输入文件一


输入文件二

TF KD/KO/overexpressed/activeted样品与对照相比,基因表达差异分析结果:全基因组上的所有基因的ID、表达量变化倍数log值(上调为正值,下调为负值)、统计值(FDR或P值)三列;

或limma、cuffdiff的输出文件

注意,不能只给差异基因。

跟GSEA类似,BETA的算法需要全局所有基因。

除了RNA-seq、microarray以外,其他实验类型也可以作为输入,只要能按要求提供那三列信息就行。


参数设置:默认即可。


输出文件长啥样?


结果一:累积分布函数CDF曲线

BETA根据默认值或您提供的基因数量或P值,把基因分为上调UP、下调DOWN、不差异表达NON三组,然后计算UP/DOWN组跟NON的差异显著性。


图中黑色点线用NON组代表背景,红色为UP组,蓝色为DOWN组。

X轴:把基因按照regulatory potential score由大到小排序;

Y轴:基因累积比例。


例如下图a,X轴10000对应的蓝线Y轴为50%,红线Y轴为30%,黑色点线Y轴为30%。

也就是说:50%的下调基因都拥有较高的调控潜能(排在top10000),显著高于上调基因和背景。更多的peak倾向于富集在下调基因周围。

生物学意义:Tet1的功能是repressive,ESR1既有activiting又有repressive功能

有一篇帖子,从概念、实际意义到R语言实现,把CDF曲线讲的透透的:

http://blog.shaochuancs.com/statistics-cdf/

点击左下角“阅读原文”,直达该帖。


结果二:靶基因


靶基因附近的peak

结果三:TF在DNA上结合的motif,包括上调靶基因区域的motif、下调靶基因的motif、上调特异的motif(跟下调的比、跟NON比)、下调特异的motif(跟上调的比、跟NON比)。


结果四:找到TF的collaborator

从结果三可以看出,找到的motif不只是目标TF的,还有其他TF的,排除相似motif以后,那些其他的TF就有可能是目标TF的collaborator。coIP搞起来!




怎么才能用上BETA呢?


有网页版吗?

有,Cistrome Analysis Pipeline提供丰富的表观遗传分析工具,可以在线分析,点点鼠标即可,不用敲代码。只是,由于不可描述的原因,小哈劝您还是用本地下载版本吧!

Windows系统能用吗?

理论上,应该可以吧!?

不懂生信,不装Linux,也能Run代码—Windows系统的Linux命令行工具Babun

如果不想装Linux,就买个苹果吧!


遇到问题可以问作者吗?

苏小妹一直活跃在BETA的google group上,有问题先去看看是不是已经有人问过了,解决了没?

在此感谢BETA作者苏小妹在本文撰写中提供的帮助!


如何打开google group?

看这里,生物人高效工作之——办公软件




https://blog.sciencenet.cn/blog-3372875-1090325.html

上一篇:miRNA家族成员列表下载 | 人/小鼠/果蝇/线虫 | 还提供命令行
下一篇:最靠谱的富集分析,超炫的展示方式,TCGA也是他的粉丝
收藏 IP: 124.77.56.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

1/0 | 闂傚倸鍊搁崐鎼佸磹閹间礁纾圭€瑰嫭鍣磋ぐ鎺戠倞妞ゆ帒顦伴弲顏堟⒑閸濆嫮鈻夐柛妯垮亹缁牓宕奸悢绋垮伎濠殿喗顨呭Λ妤呭礉閿曞倹鐓ユ繝闈涙-濡插摜绱掗悩鐑樼彧濞e洤锕俊鍫曞椽閸愨晜鏆伴梻浣告惈閹锋垹绱炴担鍓叉綎闁惧繗顫夊畷澶愭煏婵炲灝鍔滈柣婵勫灲濮婃椽鎮烽弶鎸庮唨闂佺懓鍤栭幏锟�:0 | 婵犵數濮烽弫鍛婃叏閻戝鈧倿鎸婃竟鈺嬬秮瀹曘劑寮堕幋鐙呯幢闂備浇顫夊畷妯衡枖濞戞碍顐介柕鍫濇啒閺冨牊鏅查柛娑卞幗濞堟煡姊虹粙娆惧剰妞ゆ垵顦靛濠氭晲閸涘倻鍠庨埢搴ㄥ箚瑜庨鍕煛婢跺棙娅嗙紒璇茬墕椤繘鎼圭憴鍕/闂侀潧枪閸庢煡鎮甸姀銈嗏拺闁荤喐婢樺▓鈺呮煙閸戙倖瀚� | 婵犵數濮烽弫鍛婃叏閻戣棄鏋侀柟闂寸绾惧鏌i幇顒佹儓闁搞劌鍊块弻娑㈩敃閿濆棛顦ョ紓浣哄С閸楁娊寮婚悢鍏尖拻閻庣數枪婵′粙姊洪崫鍕櫤缂佽鐗撳濠氬Ω閵夈垺鏂€闂佺硶鍓濋敋缂佹劖鐩娲川婵犲孩鐣烽悗鍏夊亾闁归棿绀佺粻鏍ㄤ繆閵堝倸浜鹃梺瀹犳椤︻垶鍩㈠鍡樼秶闁靛ě鍛帒缂傚倷绀侀崐鍝ョ矓閹绢喓鍋戝ù鍏兼綑闁卞洭鏌i弬鎸庢儓鐎殿喗濞婂缁樻媴閾忕懓绗″┑鐐插级閻楃姴鐣烽幇鏉挎嵍妞ゆ挻绋戞禍鐐叏濡厧浜鹃悗姘炬嫹 | 闂傚倸鍊搁崐鎼佸磹瀹勬噴褰掑炊瑜忛弳锕傛煕椤垵浜濋柛娆忕箻閺岀喓绱掗姀鐘崇亪缂備胶濮鹃~澶愬Φ閸曨垰绠涢柛顐f礃椤庡秹姊虹粙娆惧剾濞存粠浜璇测槈閵忕姈銊︺亜閺傚灝缍栨慨瑙勵殜閹嘲饪伴崨顓ф毉闁汇埄鍨遍〃濠傤嚕閺屻儱绠瑰ù锝呮贡閸欏棝姊虹紒妯荤闁稿﹤婀遍埀顒佺啲閹凤拷

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-1-23 04:40

Powered by ScienceNet.cn

Copyright © 2007-2025 中国科学报社

返回顶部