陈俭海分享 http://blog.sciencenet.cn/u/chenjianhai 科学需更需要勇气。你敢,这世界就不同

博文

GATK4的新功能GenomicsDBImport

已有 6985 次阅读 2020-10-9 15:09 |系统分类:科研笔记

研读GATK最佳实践的研究者可能被以下描述所吸引:

Prior to GATK4 this was done through hierarchical merges with a tool called CombineGVCFs. This tool is included in GATK4 for legacy purposes, but performance is far superior when using GenomicsDBImport, which produces a datastore instead of a GVCF file.

即,gatk4的新的合并vcf功能非常好。于是跃跃欲试,

但是

该功能适合于数千级别的样品数量,少量样品还是应该使用此前的CombineGVCFs

GenomicsDBImport is used for samples in the order of thousands. For <1000 samples it is better to use CombineGVCFs.




https://blog.sciencenet.cn/blog-1224852-1253727.html

上一篇:全外显子测序分析流程中,什么时候加入外显子区间文件
下一篇:演化的补锅匠
收藏 IP: 112.44.78.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 13:21

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部