Optitype 软件安装 最开始尝试使用docker,无奈悲剧的失败,发现bioconda有这个软件的,于是上conda,感觉比docker更方便呢。还有一个好处是,win10家庭版不支持docker,要想支持得修改注册表一通操作,太麻烦了。
# 下面两个命令选一就可以了 conda install -c bioconda optitype conda install -c bioconda/label/cf201901 optitype 123 运行和结果 很简单的一条命令就可以了。
OptiTypePipeline.py -i read_1.fq read_2.fq --dna -v -o optutype1 AMD YES的r7-4700u加持下,在近乎突破硬件极限的情况下完成了分型。 结果首先是个pdf文件,是分型结果的测序覆盖度图。 然后是一个tsv文件,分型结果,是只有ABC的结果,4位的:
A1 A2 B1 B2 C1 C2 Reads Objective 0 A*03:01 A*31:01 B*15:11 B*48:01 C*03:03 C*08:01 15556.0 15135.987999999903 HLA-LA 1.软件安装和数据库准备 继续conda,解决软件安装难题,也不需要挑战有些门槛的docker。
# 安装 conda install hla-la # 数据库下载 cd ~/miniconda3/opt/hla-la/ mkdir graphs wget http://www.well.ox.ac.uk/downloads/PRG_MHC_GRCh38_withIMGT.tar.gztar -xvzf PRG_MHC_GRCh38_withIMGT.tar.gz# 数据库索引,这步要耗30G的内存。。。,我这16G ram的笔记本靠swap扛着,速度就慢了不只一点了cd ~/miniconda3/opt/hla-la/bin/ ./HLA-LA --action prepareGraph --PRG_graph_dir ../graphs/PRG_MHC_GRCh38_withIMGT12345678910 2.用起来,分型 就简单的几个参数,8核,速度也就慢慢跑了,不知道会不会报错。
HLA-LA.pl --BAM ./2hla_sorted.bam --graph PRG_MHC_GRCh38_withIMGT --sampleID 10 --maxThreads 8 --workingDir ./1 然后在swap+ram达到极限的70G的时候停止运行了。 gihub上看到这个issue我有点绝望了,我的硬件达不到这水平呀!
my paired-end fastq file: R1.fastq (250 Million reads, 150bp, ~1.2 GB) R2.fastq (250 Million reads, 150bp, ~1.2 GB) run HLA-LA will used about 300~400 GB RAM and ~90GB swap
转载本文请联系原作者获取授权,同时请注明本文来自赵加栋科学网博客。 链接地址: https://blog.sciencenet.cn/blog-623545-1254203.html
上一篇:
如何快速查询人基因组的LD连锁不平衡信息 下一篇:
QIIME 2 2020.11发布啦