科学网

 找回密码
  注册
在线绘制基因表达谱聚类热图heatmap
陈明杰 2022-9-23 10:59
聚类热图是生物医学论文中最常见的一类图。一般情况下我们认为cluster(聚类)、 heatmap(热图)两个词表达的是同一个意思,往往相互替代。然而这两个词还是有区别的,cluster是数据处理,heatm ap 是数据展示。其过程是:用我们拿到的表达矩阵根据不同的聚类方法和不同的距离算法算出另外一个矩阵,然后对这 ...
4944 次阅读|没有评论
在线绘制“美貌与智慧并重”的圆形相关系数弦图,给文章加分!
陈明杰 2022-9-21 12:04
俗话说 “一图胜千言”,而一张“美貌与智慧并重”的图放在文章中,往往会让审稿人眼前一亮,无形中给文章加分! 相关系数是生物医学论文中最常见的一个指标,用于描述两个连续变量之间的线性相关程度,例如 A基因的表达是否和B基因的表达正相关?基因A的表达是否与其甲基化程度负相关等等。最常用的就是皮尔森相关 ...
1710 次阅读|没有评论
ChIP-Seq,MeRIP-seq峰(peak),eccDNA等基因组位置染色体分布可视化
陈明杰 2022-9-17 23:03
人类基因组由1- 22 、X、Y等染色体构成,染色体经过细胞学处理后会呈现出深浅不同的染色带。染色带的数目、部位、宽窄和着色深浅均相对稳定性,所以每一条染色体都有固定的分带模式,即称带型。染色体带型是鉴别染色体的重要依据。 图 1 . 人类染色体 通常我们可以将ChIP-seq、MeRIP-seq、eccD ...
1591 次阅读|没有评论
不知道miRNA测序数据接头就没法继续分析了吗?教你利用clustalw和blat解决接头问题
陈明杰 2022-9-16 22:31
miRNA是一类长约22 nt的非编码小RNA。miRNA通过碱基互补配对结合到靶mRNAs 3’UTRs以调控数百个基因的表达。因此,miRNA参与几乎所有生命活动,与生物体的生长、发育、疾病、衰老和死亡息息相关 ,可以作为疾病诊断和检测的生物标志物 。 日常数据分析中,我们经常会遇到各种来源的 miRNA测序原始数据,有些测3 ...
2714 次阅读|没有评论
来了,来了!GSEA官网更新,Mouse基因集终于有了“官方认证”
陈明杰 2022-9-15 21:11
长久以来 G SEA 官网 都是“稳如磐石”,Human基因集占据着统治地位,而其他物种一直没有上线。研究其他物种(例如小 鼠)的研究者不得不自己构建基因集,然而,没有官方认证的基因集往往缺乏“底气”。 9月7日,我们终于迎来了G SEA 网站的一次大更新!跟着小编一起来看看吧! ...
1968 次阅读|没有评论
数据分析,从了解你的数据开始,数据探索性分析工具包pandas-profiling
陈明杰 2022-9-13 14:46
身处大数据时代,每天接收到海量数据,例如高通量测序产生的一个样品的原始 fastq文件就高达数十甚至上百GB,然而,对我们来说,真正感兴趣的只是最终产生的excel表格形式的数据。如何从这个excel表格中找到我们感兴趣的数据及规律似乎更加重要,因为这一步是“智慧的一步”,有助于我们更好地了解生物发生、发展的规律 ...
1759 次阅读|没有评论
安利一款纯Python编写的GTF处理脚本 – GTFtools
陈明杰 2022-9-7 13:42
日常数据分析中,我们遇见最多的可能就是序列,例如基因组序列,C DS 序列等等,它们一般以fasta格式存储。由于序列一般按照从5 ’-3’ 存储,并且每个碱基都可以给一个数字编号,因此,理论上,我们仅需要两个文件,就能够从基因组中提取我们感兴趣的任意序列:一个基因组序列文件,一个带坐标的注释文件。 ...
1547 次阅读|没有评论
ClusterProfiler在线基因集富集分析(GSEA),支持自定义基因集、任意物种
陈明杰 2022-9-6 11:32
为什么 pathway富集分析结果没有我感兴趣的通路? G O 和K EGG 富集分析使用差异基因(上调基因,下调基因,或者上下调合起来的基因)作为输入,使用超几何分布等算法计算显著富集的G O term或者通路,然而,在实际数据处理中,这种使用p值和fold change 进行一刀切获得差异基因,然后进行富集分析 ...
8515 次阅读|没有评论
分久必合 -- 合并相同基因/探针的表达量
陈明杰 2022-9-4 15:29
从芯片到测序,从转录组到蛋白组,基因名的问题一直困扰着我们。 芯片 一个基因会对应 N个探针集。以最常见的 Affymetrix Human Genome U133 Plus 2.0 Array 为例, HOXD10 基因,对应着 229400_at 和 207373_at 等探针。若你研究这个基因,那么到底是以 229400_at 探针集的表达值作为 H OXD10 ...
2007 次阅读|没有评论
做研究,该用hg19还是hg38基因组?一行代码将hg19的bw文件转成hg38
陈明杰 2022-8-28 09:49
有没有想过这个问题:做研究的时候该用 hg19 还是hg38基因组? ​ 人类基因组版本现状 对于同一个物种,数据库中存在不同的基因组版本,以人类( Homo Sapiens )为例, UCSC 中有多个版本: Dec. 2013 (GRCh38/hg38) 、 Feb. 2009 (GRCh37/hg19) 、 Mar. 2006 (NCBI36/hg38) 等, ...
个人分类: 生物信息|3442 次阅读|没有评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-28 22:27

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部