生信工具生信python

PyPore: Nanopore 测序数据处理工具

2019-07-08  本文已影响5人  植物基因组

Oxford Nanopore 测序通量已经提高到了 10-20 Gb,每次可以产生数百万的 reads。这些产生的数据是以 FAST5 格式保存。FAST5 是 HDF5 格式的一个变种。但目前能直接处理这种数据格式并辅助下游分析的软件还比较少。2019 年 4 月 16 日,Bioinformatics 杂志发表了意大利的学者完成的题为“PyPore: a python toolbox for nanopore sequencing data handling”的论文,介绍了 Nanopore 测序数据处理工具 PyPore,这个软件可以生成信息丰富、交互式的图表,对于快速评价实验质量具有重要价值。

※※※

PyPore 包含三个工作模块。第一个模块读取 FAST5 文件中的信息并总结成信息丰富的质量参数图表;第二个模块把原始数据转换为 FASTQ 格式;第三个模块利用最先进的比对工具把测序数据比对到参考基因组上,并收集比对的统计信息。

※※※

PyPore 利用 Python 2.7 写作的,源代码地址为:https://github.com/rsemeraro/PyPore

※※※

PyPore 的第一个模块为 seqstats,基本用法为:

输出结果类似如下示例:

※※※

PyPore 的第二个模块为 fastqgen,基本用法为:

※※※

PyPore 的第三个模块为 alignment,基本用法为:

生成的统计交互图类似如下示例:

上一篇 下一篇

猜你喜欢

热点阅读