|
俗话说“一图胜千言”,而一张“美貌与智慧并重”的图放在文章中,往往会让审稿人眼前一亮,无形中给文章加分!
相关系数是生物医学论文中最常见的一个指标,用于描述两个连续变量之间的线性相关程度,例如A基因的表达是否和B基因的表达正相关?基因A的表达是否与其甲基化程度负相关等等。最常用的就是皮尔森相关系数,其值介于-1和1之间。
相关系数与相关程度一般划分为:
0.8 - 1.0 极强相关
0.6 - 0.8 强相关
0.4 - 0.6 中等程度相关
0.2 - 0.4 弱相关
0.0 - 0.2 极弱相关或无相关。
R语言中,我们可以使用cor()函数来计算相关性。
Python语言中,我们可以使用scipy.stats.pearsonr函数来计算相关性。
对于多个基因,计算出来的就是一个相关系数矩阵,如图1所示。
图1. 相关性矩阵
虽然这种展示方式非常直观,然而看起来比较费劲,同时占空间比较大。这时,我们可以使用圆形形式来展示相关系数矩阵,如图2所示。圆形有着天然的魅力,因为从视觉运动方面来讲,曲线具有天然的平滑性、节奏感、饱满、扩张和一定方向感,因此会让人感觉很柔美、很丰富,并且有深度和动感(摘自网络)。
图2. 圆形相关系数图
1, 打开圆形相关系数绘图页面
首先,使用浏览器(推荐chrome或者edge)打开圆形相关系数绘制页面。左侧为常见作图导航,中间为数据输入框和可选参数,右侧为描述和结果示例。也可以在主页搜索框中搜索相关系数,找到绘图页面。
https://www.bioinformatics.com.cn/plot_basic_circle_correlation_plot_133
图3.可视化绘图页面
2,示例数据
点击右侧“示例数据”链接下载excel格式的示例数据。
图4. 输入数据示例
示例数据(仅供参考)为矩阵形式,其中
行为基因
列为样品
行列相交的cell为基因在该样品中的表达值。一般需要用标准化后的值进行计算。
注意:需要参考示例数据,将自己的数据在excel中整理成示例数据的样式,每个cell都需要有,表达值不能为空或者NA。行列相反的话,可以转置后使用。
3,粘贴示例数据
直接复制示例数据中的A-K列数据,然后粘贴到输入框。
注意:不是拷贝excel文件,是拷贝excel文件里边的数据。另外粘贴到输入框后,格式乱了没关系,只要在excel中是整齐的就行。并且数据矩阵中不能有空的单元格,中文字符等。
图5. 必需输入
4,修改参数,并提交
我们设置了数据转换、相关系数计算方法、图片尺寸、colorbar位置、连线颜色、基因颜色、字体等参数,基本能满足日常绘图使用。如需更高级的定制,请联系我们。
图6.颜色、字体、colorbar位置等可调参数
5,提交出图
粘贴好输入数据,调整好参数(或者全部默认)后,点击提交按钮,几秒钟后,会在页面右侧出现预览图。我们提供了4种图片格式供下载使用,两种矢量图(pdf,svg)和两种标量图(600 dpi tiff和300 dpi png)。同时提供了相关系数矩阵计算结果供下载。
图7.预览与下载
图解读:
该图为弦图,外圈是11个基因,内圈为基因间的相关系数连线。其中A-B,与B-A的相关系数仅保留1次,因此每个弦上延伸出来10条带(去掉了自身与自身的),红色带表示正相关,绿色带表示负相关,颜色越深表示相关性越大(越正相关或越负相关),带越宽表示绝对值越大。弦上的刻度表示该基因与其他基因间的相关性的绝对值之和,因此其刻度和长度不是固定的。
没有预览就没有出图,这时请参考示例数据,检查自己输入数据的格式。
遇到文字截断,需要修改字体、调整字体大小等,请参考用inkscape编辑svg矢量图
微生信助力发文章,谷歌引用640+,知网引用480+
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-22 13:35
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社