||
aBIOTECH | 高俊祥团队开发拟南芥和水稻组织特异性regulon的推断与排序方法
转录因子(TF)通过与靶基因(TGs)的特定DNA序列相结合调节其表达,每个TF与其TGs会形成一个调控子(regulon)并完成生物学功能。植物组织中特异表达的regulon在协调相应器官的发育过程中起着至关重要的作用。基因转录和翻译需要消耗物质和能量,研究与农艺性状密切相关的组织特异性表达regulon有助于提高物质和能量的利用效率。因此,研究植物组织特异性基因调控可以揭示基因在特定组织中的表达模式,也有助于揭示基因间调控关系的一般规律和动态变化。
近日,华中农业大学信息学院高俊祥团队在 aBIOTECH 发表了题为“Inference and prioritization of tissue-specific regulons in Arabidopsis and Oryza” 的研究论文。在该研究中,作者提出了一种基于多组学数据和图神经网络的植物组织特异性调控子的推断方法,并将其命名为InferReg。
图卷积网络(GCN)可以聚合网络结构信息和节点信息以处理复杂的调控关系,表现出强大的表示和预测能力,因此,作者基于GCN开发了InferReg,其可以结合来自基因表达数据和TF结合基序数据来推断组织特异性regulons (图1A)。首先,InferReg使用GRNBoost2和表达矩阵来计算共表达网络,该网络提供了基因之间的潜在调控关系。随后,使用Spearman相关系数、TF结合位点和ChIP-seq数据对这些初始调控关系进行进一步过滤和验证。作者从拟南芥数据库中选择了3400个高质量的表达数据集,这些数据集涵盖了五种不同的组织:花(304)、叶(837)、根(886)、种子(917)、幼苗(456),每个样本分别提供了37886个基因的表达值,从而得到InferReg的37886 × 3400输入表达矩阵(图1B)。作者共鉴定到1868个由位置权重矩阵(PWM)表示的结合位点,并将其映射到1015个拟南芥TFs (图1C)。
图 1 InferReg的工作流程和拟南芥数据集
为了探究InferReg是否可以识别特定组织中存在的基因、转录因子和regulons并发挥关键作用,作者首先使用t-SNE来检查上述五种组织的RNA-seq表达谱是否存在显著的组织特异性,结果表明这五种组织的基因表达模式存在显著的组织特异性(图2A)。随后通过鉴定不同组织中的差异表达基因(DEGs)来研究每个组织中存在的特异调控关系。图2B显示了花、叶、根、种子和幼苗组织中差异表达基因的数量。接下来,作者通过分析每个组织的GCN预测的regulons来确定组织特异性调控子。调控子中的调节作用可能涉及多个基因,这些基因可以在不同的环境条件下同时或顺序表达,从而实现对细胞功能的复杂调节。作者将每个组织中的DEGs与其他组织进行比较,并从这些基因中选择特异性TF及其相应的TG,这些TF和TG结合形成组织特异性regulons。图2C显示了在五个组织中推断出的720个调控子,热图上颜色的深浅表示每个TF调节的TG数量的多少,暗示regulon活性水平的高低。这些结果表明,转录因子及其regulon参与了组织特异性调节,有助于揭示植物发育中复杂多样的转录调控。
图 2 拟南芥的组织特异性调控子
为了评估InferReg的泛化能力,作者在水稻上使用了该方法。作者收集了日本晴的各种多组学数据,其中包括来自植物表达数据库的833个RNA-seq数据集、PlantTFDB数据库中的1862个TFs和CisBP数据库中的1580个TFBS。由于水稻仅有17个可用的ChIP-seq数据,作者利用预先训练的拟南芥GCN并将其应用于水稻,然后分析由此产生的预测结果。作者对组织特异性调控进行了详细分析,共鉴定出529个调控子,并观察到同一TF在不同组织中调节的TG数量存在显著差异(图3A)。这些结果表明,InferReg可用于预测其他物种的基因调控关系和组织特异性调控子。为了探究这些基因在不同组织中的调节模式,作者创建了基因调控网络,发现了根中高度相关的调控基因:OsARF12、OsARF25 和OsARF16 (图3B)。此外,作者还发现了在根中TG数量较多但在其他组织中较少的调控子并以WOX11为例构建了一个调控网络(图3C)。作者还研究了相反的情况,识别了根中TG数量较少但叶中TG数量较多的调控子OsSND2 (图3D)。
图 3 InferReg推断水稻组织特异性调控子
该研究得到了国家自然科学基金项目的资助。华中农业大学信息学院硕士生代宏刚为本文的第一作者,华中农业大学信息学院高俊祥副教授为通讯作者。
引用本文:
Dai, H., Fan, Y., Mei, Y. et al. Inference and prioritization of tissue-specific regulons inArabidopsis and Oryza. aBIOTECH (2024). https://doi.org/10.1007/s42994-024-00176-2
相关阅读:
aBIOTECH | 中国农业大学小麦研究中心-原创算法驱动多倍体小麦复杂基因组解析
aBIOTECH | 李慧慧团队利用大规模进化信息和机器学习算法成功预测植物盐胁迫相关基因
aBIOTECH | 宋述慧/章张-国家基因组科学数据中心植物基因组学资源体系综述
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-24 01:11
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社