gncorner的个人博客分享 http://blog.sciencenet.cn/u/gncorner

博文

[转载]肿瘤微卫星不稳定检测流程分享

已有 2795 次阅读 2019-1-31 13:58 |个人分类:生信工具学习|系统分类:科研笔记| 实用流程 |文章来源:转载

背景知识

先来谈谈背景知识,主要是微卫星不稳定性的概念以及其在肿瘤检测方面的临床意义。有分子生物学背景的人应该知道微卫星是DNA基因组中核苷酸的简单重复序列,又称短串联重复(SSR)。因为其长度由重复单位的拷贝数决定,具有高度多态性,因此是比较早期的遗传标记。微卫星不稳定性(microsatellite instability, MSI)就是指简单重复序列拷贝数的增加或缺失而造成的微卫星长度的改变。

微卫星除了作为遗传标记外,现在医学中中最大的作用在于作为实体瘤(尤其是结直肠癌)预后和辅助治疗方案的重要分子标志物。据文献报道,约有15%的结直肠癌患者中存在高MSI现象,这导致该部分患者的发病机制,预后以及药物敏感性均不同。在癌症免疫疗法中,PD-1单抗治疗对MSI-H的mCRC表型出高缓解率,该疗法已被FDA认定。

上手构建流程

MISA--Catalog microsatellites present host genome (Optional)

这一步不是必须,主要是针对探究性研究中从基因组中de novo鉴定MSI。临床上一般都有固定的检测位点,通过定制的捕获测序获得。

#在misa.pl和misa.ini存放的目录下执行:/data/Oncoseq/biosoft/MISA
perl /data/Oncoseq/biosoft/MISA/misa.pl /data/Oncoseq/genome/bwa-hg19-numbered/hg19.num.fasta misa.ini

misa.ini是程序自带的参数集合,其规定的默认标准符合最后期望检出的MSI类型,因此就采用此标准即可

构建genome的bwa index

因为后续分析需要bwa比对的bam文件,所以这里先建立基因组索引。

bwa index -a bwtsw /data/Oncoseq/genome/bwa-hg19-numbered/hg19.num.fasta

注意:使用的参考基因组fa文件中的染色体名字必须是数字,不能包含“chr”前缀

BWA-MEM mapping

bwa mem -R "@RG\tID:id\tSM:sample\tLB:lib" /data/Oncoseq/genome/bwa-hg19-numbered/hg19.num.fasta /data/Oncoseq/test-data/one-sample/CL100096014_L02_9_1.fq /data/Oncoseq/test-data/one-sample/CL100096014_L02_9_2.fq | samblaster --excludeDups --addMateTags --maxSplitCount 2 --minNonOverlap 20 | samtools view -S -b - > CL1.bam

制作目标区域的baseline文件(可视为数据库,需根据样本量进行完善)

获取15个待检测MSI位点位置信息

通过查询UCSC和文献中给出的MSI引物,获得目标位点的基因组坐标,以bed文件方式存储。

需要注意的是,这里的染色体名字必须是数字,不能包含“chr”前缀

文件示例如下:

依据15个待检测位点制作msi_interval文件

该步骤需要目标检测区域bed文件作为输入。

script/create_intervals_BGI.sh BGI_15.bed

结果生成test.msi_intervals文件

制作msi_baseline文件, calculated from an MSI negative population (blood sample or MSI negative tumor)

该步骤同一protocol或assay/target data set下仅需做一次

输入文件包含全部正常样本mapping后的bam文件

script/create_baseline_BGI.sh test_baseline_bam.txt

结果生成MSI_BASELINE.txt

运行主程序,对待检样本进行分析

同样以bam文件进行输入,配置好脚本指定需要输入的文件路径,即可运行主程序:

script/run_msings_BGI.sh test_FFPE_bam.txt

结果解释

最终的结果以文件的形式展示,主要的信息文件以Analysis.txt为后缀,示例如下:

每一个位点对应的结果以0或1展示,1为instability,2为stability。这样就能判断出该样本在哪个微卫星位点上具有不稳定性了。

Tips

  • 所有mSING的shell脚本在使用前均需要配置,即修改source msings-env/bin/activatesource /data/Oncoseq/biosoft/msings/msings-env/bin/activate; 修改VARSCAN=msings-env/bin/VarScan.v2.3.7.jarVARSCAN=/data/Oncoseq/biosoft/msings/msings-env/bin/VarScan.v2.3.7.jar.


生信草堂

浙大生信博士团队倾力打造的一个科研人员学习交流的公众微信平台。我们致力于科研社区服务,分享前沿的科技进展,提供生信分析方法,解读经典分析案例,公众数据库的挖掘和临床数据统计分析。在此我们欢迎各位的加入!

加微信bioinformatics88拉您进生信交流群

0.jpg



https://blog.sciencenet.cn/blog-3353749-1160080.html

上一篇:[转载]阿尔兹海默病,基因知多少?
下一篇:[转载]经验分享|GATK4 Mutect2与 GATK3 MuTect2的应用区别
收藏 IP: 122.235.209.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-16 21:15

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部