jiyanbio1983的个人博客分享 http://blog.sciencenet.cn/u/jiyanbio1983

博文

“如何玩转生物大数据”系列:幽门螺旋杆菌感染胃癌样本特异表达

已有 4208 次阅读 2017-7-14 19:27 |个人分类:生物信息|系统分类:科研笔记

这个分析是基于公共数据TCGA的胃癌RNASeq表达谱数据。这批数据中,有20个样本幽门螺旋杆菌(+),有153个样本幽门螺旋杆菌感染(-),其他样本没有检测数据。


差异基因寻找方法:t检验,p value < 0.05

当然,还有其他常用的差异基因寻找方法:1) SAM; 2) edgeR or DEseq。这些方法的结果,暂时不公开,有更新会及时通知。


有109个是显著上调,1053个是显著下调。


用David网站,上下调的差异基因的功能富集分析。结果是可以下载的,链接在文章末尾处。


这里,我们只展示上调基因的显著功能富集的结果。因为过表达更适合做为生物标记物。


David网站用了很多基因注释来源,包括uniprot,kegg, gene ontology等。下面展示的是上调基因在各个基因注释来源中富集terms的个数。



下面,展示了上调基因的富集功能的terms。这里有一些功能很有意思,例如“GO:0031012~extracellular matrix”,“GO:0070062~extracellular exosome”,“GO:0006954~inflammatory response”。手里有样本的朋友们,可以自己设计引物验证。



这里用柱状图展示了“GOTERM_BP_DIRECT”中的terms。



下载链接:

http://pan.baidu.com/s/1nuEppMD

压缩包中有下面文件

差异基因结果:tcga_stad_hpylori.sigGenes.csv

上调基因的david富集结果: tcga_stad_hpylori.sigGenes.up.david.csv

下调基因的david富集结果:tcga_stad_hpylori.sigGenes.down.david.csv


关注“如何玩转生物大数据”微信公众号,及时获取更多内容





https://blog.sciencenet.cn/blog-3291578-1066373.html

上一篇:“如何玩转生物大数据”系列:奇怪的GBMLGG,COADREAD
下一篇:“如何玩转生物大数据”系列:基于ArrayExpress网站快速搜索功能
收藏 IP: 202.127.20.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-20 00:37

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部