zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

利用空间转录组学数据挖掘结直肠癌预后lncRNA

已有 641 次阅读 2024-11-6 11:33 |个人分类:科普|系统分类:科普集锦

利用空间转录组学数据挖掘结直肠癌预后lncRNA

结直肠癌(CRC)是2022年美国癌症死亡的第二大常见原因,占全球癌症死亡人数的10% 2023年,仅在美国就估计有15.3万例新的结直肠癌病例,这使得临床发展成为该疾病的优先事项。

根据其基因组或表观基因组状态,CRC可分为三种主要的临床亚型。这些是微卫星不稳定性(MSI)状态、染色体不稳定性(CIN)状态和CpG岛甲基化表型(CIMP)。伴有微卫星稳定(MSS)病变的肿瘤表明微卫星保持稳定且长度不变化。APC基因突变的肿瘤(70-90%)通常为MSSMSI指的是长度不同的微卫星序列,它们在功能上与DNA错配修复机制中的缺陷相关,从而导致超可变表型。大部分CRC病变是MSS,并通过CIN途径发展,其中全部或部分染色体被复制或缺失。在肿瘤抑制基因内CpG岛的高甲基化导致其转录缺失,从而导致CRC的发展。

根据上述临床亚型以及最近分类的分子亚型,肿瘤异质性是影响结直肠癌进展和预后的共同因素。此外,肿瘤间变异(如免疫浸润)在患者间也很常见。目前,肿瘤内细胞群的异质性也是CRC根治性治疗的一个障碍,因为异质性肿瘤更有可能对治疗产生耐药性或导致疾病复发。根据SEER癌症数据库对26,170例患者的研究,IVCRC患者的5年生存率仅为10.5%

因此,至关重要的是,对那些疾病复发和转移风险最大的患者给予最佳预防治疗,同时防止过度治疗无风险患者。目前,在癌症筛查和切除息肉后,患者将由包括病理学家和放射科医生在内的多学科团队根据肿瘤的分期接受辅助化疗。在III期和IV期患者完全手术切除疾病(包括转移部位)后,通常推荐辅助化疗。它也可用于临床医生认为高风险的II期患者(有许多促成因素),但不适用于不匹配修复机制(与MSI相关)缺陷的II期患者,因为他们从治疗中获益很少。总的来说,疾病分期是目前决定哪些患者将从治疗中受益的最重要的因素,而在治疗中,对于II期疾病,这可能是模棱两可的。如果一种高度特异性的II期患者的疾病复发或转移风险被确定,则生存期可能得到改善,在II期患者中,预防性治疗最有利。将风险特异性诊断与组织病理学疾病分期相结合,将大大有利于临床决策,为减少患者进展到IV期疾病提供了独特的机会,最终目标是降低疾病死亡率。

以前对癌症治疗和生物标志物的探索主要是针对蛋白质编码基因。自从发现大部分转录基因组包含非编码RNA(ncRNA)以来,对鉴定ncRNA治疗靶点和预后标志物的兴趣一直在增长。最大的一类ncRNA是长链非编码RNA(lncRNA),它被定义为长度大于500个核苷酸的转录本,不包含重要的开放阅读框架。LncRNA主要由RNA聚合酶II转录,因此被剪接、盖帽和聚腺苷化,这使得大部分lncRNA可以通过传统的基于聚腺苷化的mRNA测序方法检测到。

LncRNA已被证明在许多生物学过程中发挥重要作用,包括X染色体失活、基因表达的表观遗传调控和转录后调控。LncRNA表达的调控可导致疾病,lncRNA被描述为多种癌症的驱动因子,包括CRC。与蛋白质编码基因相比,lncRNA具有优越的组织和癌症特异性表达,因此非常适合作为肿瘤靶点。它们有潜力作为临床相关的生物标志物,以改善诊断、预测复发、治疗靶向、治疗反应和/或疾病监测。这方面的一个例子是PCA3生物标志物,它已被临床应用于前列腺癌的诊断测试。与正常前列腺组织相比,PCA3在前列腺癌(但不包括良性前列腺增生)中特异性升高34倍。PCA3检测前列腺癌的准确性高于其蛋白对应物,这表明lncRNA有潜力成为具有临床意义的生物标志物。其他lncRNA也被发现可能在未来转化为诊断性临床癌症生物标志物,其中一些突出的例子是胃癌中的H19、口腔鳞状细胞癌中的HOTAIR、膀胱癌中的UCA1CRC肝转移中的HULC

高特异性表达模式的潜力,以及使用PCRFISH的直接检测,使lncRNA有利于临床应用,因为清晰的信号和准确的预测质量直接转化为临床医生增加的确定性。从历史上看,生物标志物和治疗靶点已经使用微阵列和大量RNA测序(RNA-seq)确定。然而,这些方法可能偏向在群体平均水平上高表达基因,掩盖了在特定但小的亚群体中高表达基因。除了一些特例(如MALAT1NEAT1XIST),lncRNA在细胞内的表达水平通常低于蛋白质编码基因,并且以高度特异性的方式表达,这使得用大量RNA-seq检测它们不是最佳的。此外,大量RNA-seq方法通常包含细胞类型的混合物(包括肿瘤、基质和邻近正常组织)。使用空间转录组学可以来解决这些问题,它允许在接近单细胞分辨率下对恶性上皮细胞群体进行特异性研究,而不会丢失肿瘤及其周围微环境的空间结构。空间转录组学正在成为研究癌症的有力工具。由于肿瘤的空间背景被保留,我们能够在组织的转录组和组织病理学的指导下精确地识别和表征肿瘤的转移区域。

最近,Pinkney等人使用空间转录组学技术鉴定了301个在结直肠癌患者组织恶性区域特异性表达的lncRNA,并与邻近正常结肠上皮进行了比较(图1)。在公开可用的数据集中交叉验证了这些恶性肿瘤相关的lncRNA,并优先选择了LINC01978PLAC4LINC01303进行进一步的表征。使用公开可用的TCGA-COAD队列来评估它们与患者生存和疾病亚型表达的相关性,并使用杂交链反应(HCR)来扩增RNA荧光原位杂交(FISH)信号来评估它们在另一组患者组织中的表达,包括II期伴有异时性第二原发(“疾病复发”)的患者、IV期伴有匹配同步转移的患者,以及远离原发肿瘤的手术切除标本的正常组织相匹配。结果发现LINC01978PLAC4LINC01303作为一个特征与患者生存相关,并且LINC01303MSICIMP疾病亚型中上调。此外,HCR-FISH证实这三种lncRNA在正常结肠组织中的表达可以忽略不计,并且证实它们在II期肿瘤中可以检测到,在转移组织中表达升高。这种表达模式表明它们可能是转移性疾病发展的有用标志物,并为未来在更大的患者队列中对预后敏感性和特异性进行深入统计评估提供了前提。

image.png

1 空间转录组学证实了细胞组织成分的空间结构。A具有潜在临床相关性的lncRNA标志物鉴定和表征方法综述。B用于Visium空间基因表达谱的肿瘤切片的H&E染色,附有病理学家注释。左= P1T,中= P2T,右= P2M。红色箭头表示高核密度区域(恶性病变)。蓝色箭头表示邻近的正常组织。黄色箭头表示坏死。绿色箭头表示结缔组织间质(致密的纤维组织,细胞密度低)。比例尺= 1000µmC使用FindClusters算法(Seurat v4)对P1TP2TP2M的点进行无偏聚类,并根据转录组学特征分配细胞或组织类型。在质量控制过程中缺失点已被移除。D基于细胞类型簇的肿瘤纯度分析。邻近正常为结肠上皮“EMT结肠上皮。肿瘤为所有其他细胞类型。E每个组织中细胞和组织类型的分布,计算为每个组织中与每个簇相关斑点的总和。F与每个组织相关的总斑点百分比

参考文献

[1] Pinkney HR, Ross CR, Hodgson TO, Pattison ST, Diermeier SD. Discovery of prognostic lncRNAs in colorectal cancer using spatial transcriptomics. NPJ Precis Oncol. 2024 Oct 10;8(1):230. doi: 10.1038/s41698-024-00728-1.

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具

32. Open-ST3D高分辨率空间转录组学

33. CanCellVar:人类癌症单细胞变异图谱数据库

34. dbCRAF:人类癌症中放射治疗反应调控知识图谱

35. DDID:饮食-药物相互作用综合资源可视化和分析

36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源

image.png

 



https://blog.sciencenet.cn/blog-571917-1458818.html

上一篇:Marlene:重构单细胞数据时变网络
下一篇:miRNASNP v4:涵盖17个物种的miRNA关联SNP综合数据库
收藏 IP: 39.128.49.*| 热度|

1 郑永军

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-24 07:47

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部