jgu的个人博客分享 http://blog.sciencenet.cn/u/jgu

博文

基于变分自编码器的单细胞转录组低维表示与可视化

已有 4676 次阅读 2018-12-28 14:31 |个人分类:科研笔记|系统分类:论文交流| 深度学习, 变分自编码器, 单细胞转录组, 低维表示, 可视化

近年来,单细胞RNA测序技术(scRNA-seq)的迅速发展使得研究人员能够在单细胞层次上研究生物系统的转录异质性,这种信息通常难以通过传统的组学数据获得。然而,在单细胞层次上,转录组的随机波动会远远大于细胞群体的平均行为,另一方面,单个细胞的RNA总量极低,使得其准确测量极具挑战,因此目前的单细胞测序数据存在很大的噪声。其中,dropout现象是一种主要的噪声,即很多表达的mRNA没有被捕捉到,导致检测出来的表达量为0。有效的低维表示可以降低scRNA-seq数据中的噪声,从而使得我们能够更好的分析细胞类型与状态,并实现细胞分布的可视化展示。


f1.png


本研究中,我们提出了一种基于深度变分自编码器的scRNA-seq数据分析方法——VASC,有效实现scRNA-seq数据的非监督降维与可视化。VASC对dropout现象进行了建模,并通过深度神经网络发现数据中复杂的非线性模式、降低数据噪声,从而做到可靠的数据降维与可视化。我们在超过20个数据集上(包含目前主流的scRNA-seq技术,例如SMART-Seq,inDrop,10X等)测试了VASC的低维表示性能,结果表明在大多数数据集中,VASC都能更好的提取细胞类型或者细胞分化过程的信息,体现了VASC广泛的适应性。


f2.png


VASC代码可以从 https://github.com/wang-research/VASC/ 免费获得。

论文引用:

Dongfang Wang, Jin Gu#. VASC: dimension reduction and visualization of single cell RNA sequencing data by deep variational autoencoder. Genomics, Proteomics & Bioinformatics 2018, Accepted.




https://blog.sciencenet.cn/blog-407531-1154001.html

上一篇:HCCDB--打造一站式检索的肝癌基因表达图谱
下一篇:肿瘤免疫微环境的空间异质性:单细胞组学分析发现肿瘤边界区富集的T细胞亚群可预测肝癌患者预后
收藏 IP: 101.5.128.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 13:57

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部