||| |
先来谈谈背景知识,主要是微卫星不稳定性的概念以及其在肿瘤检测方面的临床意义。有分子生物学背景的人应该知道微卫星是DNA基因组中核苷酸的简单重复序列,又称短串联重复(SSR)。因为其长度由重复单位的拷贝数决定,具有高度多态性,因此是比较早期的遗传标记。微卫星不稳定性(microsatellite instability, MSI)就是指简单重复序列拷贝数的增加或缺失而造成的微卫星长度的改变。
微卫星除了作为遗传标记外,现在医学中中最大的作用在于作为实体瘤(尤其是结直肠癌)预后和辅助治疗方案的重要分子标志物。据文献报道,约有15%的结直肠癌患者中存在高MSI现象,这导致该部分患者的发病机制,预后以及药物敏感性均不同。在癌症免疫疗法中,PD-1单抗治疗对MSI-H的mCRC表型出高缓解率,该疗法已被FDA认定。
这一步不是必须,主要是针对探究性研究中从基因组中de novo鉴定MSI。临床上一般都有固定的检测位点,通过定制的捕获测序获得。
#在misa.pl和misa.ini存放的目录下执行:/data/Oncoseq/biosoft/MISA
perl /data/Oncoseq/biosoft/MISA/misa.pl /data/Oncoseq/genome/bwa-hg19-numbered/hg19.num.fasta misa.ini
misa.ini是程序自带的参数集合,其规定的默认标准符合最后期望检出的MSI类型,因此就采用此标准即可
因为后续分析需要bwa比对的bam文件,所以这里先建立基因组索引。
bwa index -a bwtsw /data/Oncoseq/genome/bwa-hg19-numbered/hg19.num.fasta
注意:使用的参考基因组fa文件中的染色体名字必须是数字,不能包含“chr”前缀
bwa mem -R "@RG\tID:id\tSM:sample\tLB:lib" /data/Oncoseq/genome/bwa-hg19-numbered/hg19.num.fasta /data/Oncoseq/test-data/one-sample/CL100096014_L02_9_1.fq /data/Oncoseq/test-data/one-sample/CL100096014_L02_9_2.fq | samblaster --excludeDups --addMateTags --maxSplitCount 2 --minNonOverlap 20 | samtools view -S -b - > CL1.bam
通过查询UCSC和文献中给出的MSI引物,获得目标位点的基因组坐标,以bed文件方式存储。
需要注意的是,这里的染色体名字必须是数字,不能包含“chr”前缀
文件示例如下:
该步骤需要目标检测区域bed文件作为输入。
script/create_intervals_BGI.sh BGI_15.bed
结果生成test.msi_intervals
文件
该步骤同一protocol或assay/target data set下仅需做一次
输入文件包含全部正常样本mapping后的bam文件
script/create_baseline_BGI.sh test_baseline_bam.txt
结果生成MSI_BASELINE.txt
同样以bam文件进行输入,配置好脚本指定需要输入的文件路径,即可运行主程序:
script/run_msings_BGI.sh test_FFPE_bam.txt
最终的结果以文件的形式展示,主要的信息文件以Analysis.txt
为后缀,示例如下:
每一个位点对应的结果以0或1展示,1为instability
,2为stability
。这样就能判断出该样本在哪个微卫星位点上具有不稳定性了。
所有mSING的shell脚本在使用前均需要配置,即修改source msings-env/bin/activate
为source /data/Oncoseq/biosoft/msings/msings-env/bin/activate
; 修改VARSCAN=msings-env/bin/VarScan.v2.3.7.jar
为VARSCAN=/data/Oncoseq/biosoft/msings/msings-env/bin/VarScan.v2.3.7.jar
.
生信草堂
浙大生信博士团队倾力打造的一个科研人员学习交流的公众微信平台。我们致力于科研社区服务,分享前沿的科技进展,提供生信分析方法,解读经典分析案例,公众数据库的挖掘和临床数据统计分析。在此我们欢迎各位的加入!
加微信bioinformatics88拉您进生信交流群
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-30 04:55
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社