李雷廷的个人博客分享 http://blog.sciencenet.cn/u/llt001

博文

PyPore: Nanopore 测序数据处理工具

已有 6860 次阅读 2019-7-8 09:47 |系统分类:论文交流

Oxford Nanopore 测序通量已经提高到了 10-20 Gb,每次可以产生数百万的 reads。这些产生的数据是以 FAST5 格式保存。FAST5 是 HDF5 格式的一个变种。但目前能直接处理这种数据格式并辅助下游分析的软件还比较少。2019 年 4 月 16 日,Bioinformatics 杂志发表了意大利的学者完成的题为“PyPore: a python toolbox for nanopore sequencing data handling”的论文,介绍了 Nanopore 测序数据处理工具 PyPore,这个软件可以生成信息丰富、交互式的图表,对于快速评价实验质量具有重要价值。



PyPore 包含三个工作模块。第一个模块读取 FAST5 文件中的信息并总结成信息丰富的质量参数图表;第二个模块把原始数据转换为 FASTQ 格式;第三个模块利用最先进的比对工具把测序数据比对到参考基因组上,并收集比对的统计信息。



PyPore 利用 Python 2.7 写作的,源代码地址为:https://github.com/rsemeraro/PyPore



PyPore 的第一个模块为 seqstats,基本用法为:

输出结果类似如下示例:



PyPore 的第二个模块为 fastqgen,基本用法为:



PyPore 的第三个模块为 alignment,基本用法为:


生成的统计交互图类似如下示例:




https://blog.sciencenet.cn/blog-656335-1188546.html

上一篇:Nanopype: 模块化、可伸缩的 Nanopore 数据处理 pipeline
下一篇:植物基因组(plantgenomes)微信公众号 2019 年 1-6 月推文列表
收藏 IP: 58.32.222.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

全部作者的精选博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-19 18:43

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部