ChengyangWang的个人博客分享 http://blog.sciencenet.cn/u/ChengyangWang

博文

heatmap画不好会得出错误结论

已有 4206 次阅读 2017-12-18 12:22 |个人分类:RNA-seq|系统分类:科普集锦| RNA-seq


本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome

作者:小哈   来源:嘉因

大家都会做方便面,有人做辛拉面,有人做三鲜伊面,工艺有何不同?


大家都会做RNA-seq,有人能筛出有意义的基因,有人能找出有价值的线索,有人。。。差别在哪?


前两期介绍了数据均一化处理和差异基因筛选的合理方法:


数据预处理:同一套RNA-seq,为什么公司做的跟师兄跑的结果不一样? | TPM、read counts、RPKM/FPKM你选对了吗?


差异基因筛选:同一套RNA-seq,公司筛出的差异基因跟师兄筛出的为什么不一样?| Pvalue, FDR, cutoff


本文一起看RNA-seq数据画heatmap有啥讲究?




同一套数据,用不同的方法得到的heatmap差别能有多大?


举个栗子,左边一坨mass不能看,右边出现明显的一块一块才好看

把heatmap画好看就行了?NO,数据处理方法要合适。


前年介绍过批次效应对实验结果的影响:人和小鼠心脏之间的差异远大于人的心肝脾肺?


下图是每两个samples相关性的heatmap,一大块一大块的聚到一起,挺好看的吧?仔细一看,发现同一物种的各个器官聚到了一起:

后来发现是实验设计出了问题,两个物种是分批测的:

把批次效应batch effect考虑进去,同一器官聚到一起:

具体去读这篇paper,这种反驳类的文章都很精彩,数据处理的细节都描述的很清楚,还给出了文中用的code。点击左下角“阅读原文”直达paper页面,拖到末尾看F1000最宝贵的comment。


下面是画heatmap的原理视频。statQuest总能把貌似高深的算法清晰的讲解出来,易懂。



 

heatmap是可视化,把数字变成彩色的图块。让heatmap好看的关键在于聚类。

具体讲HCL



K-means








https://blog.sciencenet.cn/blog-3372875-1090302.html

上一篇:同一套RNA-seq,公司筛出的差异基因跟师兄筛出的为什么不一样?
下一篇:富集分析,俩人做的结果差5岁 | 你用的注释文件有多老?
收藏 IP: 124.77.56.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-24 20:00

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部