生物信息软件

bioawk

2016-03-06  本文已影响722人  gada

bioawk是awk的超集.

bioawk能额外解析的生物数据格式

$ bioawk -c help

bed为常见的染色体位置格式

sam格式为比对结果的格式

vcf为突变结果格式

gff格式用的少

fastx为序列格式,包括fasta和fastq

示例

只取长度为166的序列

    bioawk -c fastx 'length($seq)==166{print "@"$name"\n"$seq"\n+\n"$qual}'  in.fq > out.fq
上一篇 下一篇

猜你喜欢

热点阅读