zd200572的个人博客分享 http://blog.sciencenet.cn/u/zd200572

博文

snpQT-又一个人基因组SNP填充和GWAS流程

已有 2867 次阅读 2021-9-12 12:28 |个人分类:biology|系统分类:科研笔记


发现搜索引擎是个神奇的东西,偶然想起的关键词一搜索,获得的就是意想不到的结果,我以imputation+qc搜索,就找到了snpQT(发音Snip Cute)这样一个神奇的工具/流程。
这个流程的目的是让你的SNP cute,为处理人类基因变异提供了帮助:

  • 基因组版本转换(b37->b38或者反过来)

  • 样本质控

  • 人群分层

  • 填充前质控

  • 本地填充

  • 填充后质控

  • GWAS
    使用自动化的nextflow流程,我们在Singularity容器或 Anaconda 环境中运行一系列版本的生物信息学软件,以提高可靠性和可重复性。

snpQT的目标用户:

如是你有如下的想法,它也许是有用的:

  • 使用可重复、快速和全面的流程获得一个干净的基因组数据集

  • 对识别某个特征的重要 Snp 关联有兴趣

  • 想要根据祖源识别和删除离群值

  • 想要本地填充

  • 您希望准备您的基因组数据集,以便在外部服务器中进行引种(遵循全面的 QC 和填充前 QC 准备)

你需要怎样开始

  • 已经获得snp,基于b37/38

  • 变异为vcf/plink格式

  • 变异有rs号

  • 样本有二分类/数量性状
    如果你符合以上几点,看看文档吧:
    https://snpqt.readthedocs.io/en/latest/
    snpQT可能对你没用,如果你想:

  • 原始序列质控

  • call变异

  • 家系GWAS

  • 非人基因组数据

引用:

好像并没有发表在好的杂志上,康奈尔大学团队做的。
Vasilopoulou C, Wingfield B, Morris AP and Duddy W. snpQT: flexible, reproducible, and comprehensive quality control and imputation of genomic data [version 1; peer review: 2 approved with reservations]. F1000Research 2021, 10:567 (https://doi.org/10.12688/f1000research.53821.1)

证书和第三方软件

GPL3,流程离不开以下第三方软件,看起来还版本还挺新的:

SoftwareVersionReferenceLicense
EIGENSOFT7.2.1Price, Alkes L., et al. "Principal components analysis corrects for stratification in genome-wide association studies." Nature genetics 38.8 (2006): 904-909.Custom open source
impute51.0Rubinacci, Simone, Olivier Delaneau, and Jonathan Marchini. "Genotype imputation using the positional burrows wheeler transform." PLoS Genetics 16.11 (2020): e1009049.APAAcademic use only
nextflow20.10.0Di Tommaso, Paolo, et al. "Nextflow enables reproducible computational workflows." Nature biotechnology 35.4 (2017): 316-319.GPL3
picard2.24.0
MIT
PLINK1.90b6.18Purcell, Shaun, et al. "PLINK: a tool set for whole-genome association and population-based linkage analyses." The American journal of human genetics 81.3 (2007): 559-575.GPL3
PLINK22.00a2.3Chang CC, Chow CC, Tellier LCAM, Vattikuti S, Purcell SM, Lee JJ (2015) Second-generation PLINK: rising to the challenge of larger and richer datasets. GigaScience, 4.GPL3
samtools1.11Danecek, P.et al.(2021). Twelve years of SAMtools and BCFtools.GigaScience,10(2), 1a

https://blog.sciencenet.cn/blog-623545-1303875.html

上一篇:QIIME 2 2021.8到来啦
下一篇:QIIME 2 2021.11发布啦
收藏 IP: 183.208.20.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-24 01:23

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社