jgu的个人博客分享 http://blog.sciencenet.cn/u/jgu

博文

JGG|区域性表达的基因:基于图的单细胞特征基因选择方法 精选

已有 5644 次阅读 2022-4-11 08:09 |系统分类:论文交流

区域性表达的基因:基于图的单细胞特征基因选择方法

 

近年来,单细胞转录组测序技术的突破性进展,使得人们对生命规律的系统性解析进入单细胞时代。单细胞转录组测序数据分析存在维度高、噪声大等挑战,选择出更具生物学意义的特征基因是分析的关键步骤,目前主流的方法是选择方差大的基因(highly variable genes)。而人在挑选特征基因时,通常不是评估基因表达方差的大小,而倾向于在低维空间里寻找具有局部聚集表达模式的基因。能否用计算模型模拟人挑选特征基因的方法呢?

 

博客按:本文介绍的是一个很“小”的算法工作,提出了一种评估基因表达聚集性表达模式的评分函数,但这个工作是近年来我最满意的一个工作。首先,创意新、开放讨论多,从机器视觉辅助特征的创意选择出发,王事成经过与多人、多次讨论,逐步到提出基于图的评分函数。其二,数学工夫足,吴艳红、胡启帆没有止步于评分函数的各种基于数据的评估指标,而是从数学上证明了何总表达模式可以使评分函数达到极大值。其三,坚持、精益求精,两位主要完成人从本科毕设开始从即将毕业的师兄接过了接力棒,后续又陆续增加了空间转录组的测试,并独立的完成了论文草稿的写作和修改,整个工作从2019年提出想法开始,持续了2年半的时间。最后,HRG方法的确性能优越、计算速度快,同时适用于单细胞和空间转录组数据http://lifeome.net/software/hrg/)。

 

20222月,Journal of Genetics and Genomics在线发表课题组最新研究成果“Highly Regional Genes: Graph-Based Gene Selection for Single Cell RNA-seq Data”的研究论文。该研究基于人眼进行特征基因选择的直观原则,提出了基于图模型的特征基因选择方法HRGHighly Regional Genes)。

 

HRG方法的核心是提出了评估在细胞近邻图中“基因聚集性表达程度”的评分函数,表达量越高且在图中越聚集的基因评分越高。首先将细胞降到低维空间,在低维空间构建细胞近邻图,然后基于评分函数评估基因的聚集性表达程度,并以该得分排序进行特征基因选择。论文从理论上分析了评分函数的数学特性,表明其符合人眼挑选特征基因的基本原则。HRG还可采用迭代的方式优化近邻图,也具有很好的可扩展性,可用于空间转录组挑选在空间上具有聚集性表达模式的特征基因。与现有的几种主流的特征基因选择方法相比,HRG挑选出的基因能取得更好的聚类效果,对降采样噪声显示出更强的鲁棒性,方法所耗时间、计算资源也较少。总的来说,HRG能够很好地挑选出具有生物学意义的特征基因,能有效提升聚类等下游计算分析的性能。HRG方法的RHighlyRegionalGenes已公开发布(http://lifeome.net/software/hrg/),欢迎下载使用。

1.jpg

A: 算法流程图。B, C:各个特征选择方法对于降采样(B)和非均匀采样(C)的鲁棒性

 

清华大学自动化系生物信息学部博士生吴艳红胡启帆为该论文共同第一作者,古槿副教授为通讯作者。相关工作得到国家重点研发计划、国家自然科学基金等资助。

 

引用:Yanhong Wu, Qifan Hu, Shicheng Wang, Changyi Liu, Yiran Shan, Wenbo Guo, Rui Jiang, Xiaowo Wang, Jin Gu. Highly Regional Genes: graph-based gene selection for single-cell RNA-seq data. Journal of Genetics and Genomics 2022.

 

DOI: https://doi.org/10.1016/j.jgg.2022.01.004




https://blog.sciencenet.cn/blog-407531-1333347.html

上一篇:组学大数据定义肝癌尿素循环失活新亚型
下一篇:scCancer2: 基于机器学习整合多篇文献细胞亚群定义的肿瘤微环境深度注释工具
收藏 IP: 183.173.172.*| 热度|

1 黄永义

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 10:07

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部