zd200572的个人博客分享 http://blog.sciencenet.cn/u/zd200572

博文

ngs进行HLA分型的尝试

已有 3399 次阅读 2020-10-13 11:03 |个人分类:biology|系统分类:科研笔记

Optitype

软件安装

最开始尝试使用docker,无奈悲剧的失败,发现bioconda有这个软件的,于是上conda,感觉比docker更方便呢。还有一个好处是,win10家庭版不支持docker,要想支持得修改注册表一通操作,太麻烦了。

# 下面两个命令选一就可以了
conda install -c bioconda optitype
conda install -c bioconda/label/cf201901 optitype
123

运行和结果

很简单的一条命令就可以了。

 OptiTypePipeline.py  -i read_1.fq read_2.fq --dna -v -o optutype1

AMD YES的r7-4700u加持下,在近乎突破硬件极限的情况下完成了分型。
结果首先是个pdf文件,是分型结果的测序覆盖度图。
在这里插入图片描述
然后是一个tsv文件,分型结果,是只有ABC的结果,4位的:

        A1      A2      B1      B2      C1      C2      Reads   Objective
0       A*03:01 A*31:01 B*15:11 B*48:01 C*03:03 C*08:01 15556.0 15135.987999999903

HLA-LA

1.软件安装和数据库准备

继续conda,解决软件安装难题,也不需要挑战有些门槛的docker。

# 安装
conda install hla-la # 数据库下载
cd ~/miniconda3/opt/hla-la/ mkdir graphs  wget http://www.well.ox.ac.uk/downloads/PRG_MHC_GRCh38_withIMGT.tar.gztar -xvzf PRG_MHC_GRCh38_withIMGT.tar.gz# 数据库索引,这步要耗30G的内存。。。,我这16G ram的笔记本靠swap扛着,速度就慢了不只一点了cd ~/miniconda3/opt/hla-la/bin/
./HLA-LA --action prepareGraph --PRG_graph_dir ../graphs/PRG_MHC_GRCh38_withIMGT12345678910

2.用起来,分型

就简单的几个参数,8核,速度也就慢慢跑了,不知道会不会报错。

HLA-LA.pl --BAM ./2hla_sorted.bam   --graph PRG_MHC_GRCh38_withIMGT --sampleID 10 --maxThreads 8  --workingDir ./1

然后在swap+ram达到极限的70G的时候停止运行了。
gihub上看到这个issue我有点绝望了,我的硬件达不到这水平呀!

my paired-end fastq file:
R1.fastq (250 Million reads, 150bp, ~1.2 GB)
R2.fastq (250 Million reads, 150bp, ~1.2 GB)
run HLA-LA will used about 300~400 GB RAM and ~90GB swap




https://blog.sciencenet.cn/blog-623545-1254203.html

上一篇:如何快速查询人基因组的LD连锁不平衡信息
下一篇:QIIME 2 2020.11发布啦
收藏 IP: 58.212.162.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-13 17:20

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部