jiyanbio1983的个人博客分享 http://blog.sciencenet.cn/u/jiyanbio1983


  • 中国科学院,上海生命科学研究院,助理研究员

    • 生命科学->遗传学与生物信息学->生物信息学

    扫一扫,分享此博客主页
你需要登录后才可以留言 登录 | 注册


统计信息

已有 79370 人来访过

“如何玩转生物大数据”系列:理解ENCODE metadata 2017-07-19
ENCODE的数据量非常庞大,有将近14000个实验(experiments)。 为了帮助用户方便检索dataset及其metdata,ENCODE提供了网络接口,具体方法见 ht ...
(4813)次阅读|(0)个评论
“如何玩转生物大数据”系列:ENCODE数据分析经验分享(一) 2017-07-17
ENCODE是一个伟大的项目,目的是创建基因组注释目录。该项目通过各种实验技术,研究了近千种细胞系和组织。ENCODE的访问网址, https://www.encodeproject.org ...
(15939)次阅读|(0)个评论
“如何玩转生物大数据”系列:基于ArrayExpress网站快速搜索功能 2017-07-16
Find functional genomics data quickly and easily by using ArrayExpress Yan Ji ArrayExpress is a database of functional genomics data ( http://www ...
(8829)次阅读|(0)个评论
“如何玩转生物大数据”系列:幽门螺旋杆菌感染胃癌样本特异表达 2017-07-14
这个分析是基于公共数据TCGA的胃癌RNASeq表达谱数据。这批数据中,有20个样本 幽门螺旋杆菌 (+),有153个样本 幽门螺旋杆菌 感染(-),其他样本没有检 ...
(4209)次阅读|(0)个评论
“如何玩转生物大数据”系列:奇怪的GBMLGG,COADREAD 2017-07-13
自己动手分析过TCGA数据的朋友们,都会遇到这样的肿瘤类型组合 1)GBM,LGG,GBMLGG 2)COAD,READ,COADREAD 我一直认为,既然TCGA这样命名,它 ...
(8798)次阅读|(0)个评论
“如何玩转生物大数据”系列:TCGA的样本注释信息和数据类型统计 2017-07-12
TCGA样本原数据(metadata)可以从 https://portal.gdc.cancer.gov 下载。文件格式是JSON,因此需要一个解析文件的步骤,把JSON转化成便于阅读的表格。有 ...
(14660)次阅读|(1)个评论
用于聚类验证的R包:clValid 2017-07-10
聚类是一种无监督技术,用于在多维特征空间中对彼此接近的对象进行分组,通常是为了揭示数据所具有的一些固有结构。聚类是高通量基因组数据分析中常用的一种方 ...
(5825)次阅读|(0)个评论
测序数据质量控制:多样本的fastqc结果,一目了然! 2017-07-09
The analysis report of quality control of fastq files Introduction to FASTQC software The quality control of fastq data produced by high ...
(7712)次阅读|(0)个评论

查看更多

    Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

    GMT+8, 2024-12-20 00:43

    Powered by ScienceNet.cn

    Copyright © 2007- 中国科学报社

    返回顶部