|
Oxford Nanopore 测序通量已经提高到了 10-20 Gb,每次可以产生数百万的 reads。这些产生的数据是以 FAST5 格式保存。FAST5 是 HDF5 格式的一个变种。但目前能直接处理这种数据格式并辅助下游分析的软件还比较少。2019 年 4 月 16 日,Bioinformatics 杂志发表了意大利的学者完成的题为“PyPore: a python toolbox for nanopore sequencing data handling”的论文,介绍了 Nanopore 测序数据处理工具 PyPore,这个软件可以生成信息丰富、交互式的图表,对于快速评价实验质量具有重要价值。
※※※
PyPore 包含三个工作模块。第一个模块读取 FAST5 文件中的信息并总结成信息丰富的质量参数图表;第二个模块把原始数据转换为 FASTQ 格式;第三个模块利用最先进的比对工具把测序数据比对到参考基因组上,并收集比对的统计信息。
※※※
PyPore 利用 Python 2.7 写作的,源代码地址为:https://github.com/rsemeraro/PyPore
※※※
PyPore 的第一个模块为 seqstats,基本用法为:
输出结果类似如下示例:
※※※
PyPore 的第二个模块为 fastqgen,基本用法为:
※※※
PyPore 的第三个模块为 alignment,基本用法为:
生成的统计交互图类似如下示例:
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 19:55
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社