|||
寒冷的冬季,一张美美的火山图,让你的心暖暖的!
什么是火山图
火山图(Volcano Plot)是我们做芯片,RNA-seq等分析时常用的一种图,它能够清晰地展示显著上调和下调的基因,因作出来的图形如火山喷发(从0点开始往上,往两边扩散),故名。
例如图中,X轴一般表示log2的倍数变化(Cancer vs Normal),Y轴一般表示-log10(p-value),不同颜色的点表示满足不同条件的基因,红色表示上调基因(P<0.05, Fold change >=2),蓝色表示下调基因(P<0.05, Fold change <=-2),灰色表示不显著的基因(即要么Fold change不满足阈值,要么Pvalue不满足阈值,要么Fold change和Pvalue都不满足阈值),两条垂直虚线表示Fold change(这里默认2倍,即log2(2)=1),一条水平线表示Pvalue阈值(默认0.05)。
火山图是微生信平台首批上线的常见图,虽然我们经过了大量优化,增加了诸多可调参数:颜色,点大小,甚至legend的位置和顺序都进行了优化,但是,还是不能满足同学们的需求:
1, 能不能标注我感兴趣的基因?
2, 能不能给点加上透明度?
3, 能不能额外加些线?
4, 能不能放大某些点?
5, 能不能把p值为0的点阈值宽松点?
6, 能不能标注下上调多少,下调多少?
……
可以负责任地告诉大家,都能满足,But,诚如我们在8h基础讲解中所说的:任何在线工具都不能满足您的定制需求。要想满足,需要你自己编程或者编辑生成的图,或者两者结合起来才能完成一张美图的绘制。
今天,给大家带来的是enhanced volcano plot R包。这个R包非常优秀,具体请参考R包官方说明。这里我们还是给不懂编程的同学带来不一样的火山图体验。
1, 打开enhanced volcano 绘图页面
http://www.bioinformatics.com.cn/plot_enhanced_volcano_plot_138
2, 下载示例数据
下载右侧示例数据excel
其中第一列为基因名,必需唯一,否则不会出图;第二列为log2Foldchange,正值和0值表示上调,负值表示下调;第三列为P值,范围从0到1。
红色基因为我们待标注的top10基因(上调5个,下调5个)
3, 拷贝并粘贴数据
拷贝第一列,第二列,第三列的数据到第一个“绘图数据”输入框(带有表头),并拷贝红色的待标注基因到第二个“待标注基因”输入框(仅拷贝基因,中文注释不用拷贝)。
4, 修改参数,并提交
该函数包含几十种参数,我们这里仅列了一些常见的参数供大家使用。
包括:图片大小,字体大小,颜色,点形状,阈值,标注是否带框等等。基本可以满足90%的需求了。
如果你有另外10%的需求,请直接联系我们进行定制!
5, 提交出图
没有预览就是没有出图,这时请检查输入数据格式!
美美的火山图就出来了,超简单吧。但是,注意:左侧是标了5个,右侧怎么只标注了3个还重叠了?
经验总结:在实际使用过程中,我们发现,标注还跟坐标轴的范围、点大小等因素相关,因此,这里我们要适当调整下坐标轴的范围,例如把X轴最大值调整7,重新出图,并且标注带线(最后一个选项)
最终的图就出来了,左边标注5个,右边标注5个,且很清晰,基本满足老板的需求了!
总之,图中所标注基因的名字是通过算法算出来的,当遇到密集的标注时,该程序还是有点不足之处,例如文字重叠、连线交叉等等,在所难免。这时,您就需要私人订制了!
微生信简介
微生信云平台(http://www.bioinformatics.com.cn)以120多款在线作图、在线数据分析为基本方式,致力于0代码分析科研数据,0代码展示数据结果,帮助生命科学、医学等领域的科研工作者更便捷地分析数据,了解数据,挖掘数据背后的生物医学意义,辅助科研,促进知识传播。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-22 23:23
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社