生信linux

生信地基系列--Bioconvert互转大部分生信格式

2022-09-18  本文已影响0人  可能性之兽

生命科学使用许多不同的形式。它们可能很旧,或者语法复杂,转换这些格式可能是一个挑战。生物转换的目的是提供一个共同的工具/界面,将生命科学数据格式从一种转换为另一种。

许多转换工具已经存在,但它们可能是分散的,集中在几个特定的格式,难以安装,或没有优化。通过Bioconvert,计划覆盖广泛的格式转换; 这个项目将尽可能重用现有的工具,并提供通过基准比较不同的转换工具或方法的设施。如果认为新的实现比现有的实现更好,则提供新的实现。

在2022年3月,有48种格式,98种直接转换(125种不同的方法)。


image.png
pip install bioconvert
bioconvert fastq2fasta input.fastq output.fasta
bioconvert fastq2fasta input.fq    output.fasta
bioconvert fastq2fasta input.fq.gz output.fasta.gz
bioconvert fastq2fasta input.fq.gz output.fasta.bz2
bioconvert --help
bioconvert fastq2fasta --help
# import a converter
from bioconvert.fastq2fasta import FASTQ2FASTA

# Instanciate with infile/outfile names
convert = FASTQ2FASTA(infile, outfile)

# the conversion itself
convert()

bioconvert/bioconvert: Bioconvert is a collaborative project to facilitate the interconversion of life science data from one format to another. (github.com)

上一篇 下一篇

猜你喜欢

热点阅读