李雷廷的个人博客分享 http://blog.sciencenet.cn/u/llt001

博文

Crisflash: 基于VCF文件设计CRISPR guide RNA的软件

已有 2877 次阅读 2019-1-21 10:26 |系统分类:论文交流

前面的推文介绍过针对人类基因组设计 sgRNA 的网页工具 PAVOOC 和针对植物基因组设计 sgRNA 的在线工具和软件 CRISPR-Local。今天再介绍一个 2019 年 1 月 12 日发表于 Bioinformatics 杂志上的设计 sgRNA 的软件 Crisflash。

01

论文的题目为:Crisflash: Open-source software to generate CRISPR guide RNAs against genomes annotated with individual variation(https://doi.org/10.1093/bioinformatics/btz019)。

02

论文的作者为英国剑桥癌症研究所的 Adrien Jacquin, Duncan Odom, 和 Margus Lukk。


(此处应该是 Adrien LS Jacquin 的照片,可惜没找到)

Duncan Odom

Margus Lukk


03

Crisflash 软件的设计初衷在于快速设计 sgRNA,并发现潜在的脱靶位点,同时考虑性能和灵活性。Crisflash 可以基于任何测序基因组或基因组序列快速设计 sgRNA, 并可以通过用户提供的 variation 数据优化靶向精确度。Crisflash 相比于同类软件速度极快,即使只用单核CPU。Crisflash 可以高效、稳定地输出候选 CRISPR guide 寡核苷酸所有潜在的脱靶位点,并打分排序。


04

Crisflash 是利用 C 语言编写的,源代码地址为:https://github.com/crisflash/crisflash。 

05

安装 Crisflash 只需要下面两条命令即可:

Crisflash 的二进制文件就会出现在 bin/crisflash。


06

示例命令1:

检验 candidate_sequence.fa 中所有的 sgRNA 在 genome.fa 中的脱靶位点,最多允许 5 个错配。


示例命令2:

同上,不同在于输出 Cas-OFFinder 格式


示例命令3:

同示例命令1,不同在于参考基因组序列会根据 phased_variants.vcf 中的 variant 数据做适应性地改变。输出格式类似 Cas-Offinder 格式。


示例命令4:

返回基因组中所有 PAM 序列为 "NNNRYAC" 的 gRNA 序列。


07

Crisflash 的参数:

08

评论:

相比于 PAVOOC 只能设计人类基因组的 sgRNA,Crisflash 不限制物种,只要给软件两个 FASTA 序列文件即可设计sgRNA、检测脱靶情况。相比于 CRISPR-Local 的源代码程序(Perl 语言编写)而言,Crisflash 是利用 C 语言编写,速度和效率占优,且支持利用 VCF 文件修正参考基因组。不过 Crisflash 相比于另外两个工具的缺点在于没有图形用户界面(网页客户端),不方便不熟悉命令行操作的研究者使用。另外,Crisflash 不支持如 CRISPR-Local 的基于 GFF 文件的针对基因区域的设计策略。


欢迎关注“植物基因组”微信公众号


搜索微信公众号“植物基因组”或“plantgenomes”关注



https://blog.sciencenet.cn/blog-656335-1158264.html

上一篇:GTRD:基因转录调节数据库-2019年更新
下一篇:Picard MarkDuplicates running slower with more CPUs
收藏 IP: 116.238.93.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-26 20:43

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部