使用bioawk对基因组fasta序列ID(染色体/scaffo

2021-04-22  本文已影响0人  生物信息与育种

需求

已知某基因组序列,染色体或scaffold ID顺序不定,想要对其按数字排序。


image.png

原顺序:


image.png

想要的排序结果:


image.png

实现

使用bioawk,没有的话conda直接安装。

bioawk -c fastx '{print}' old.genome.fa |  \
  sort -k1,1V | awk '{print ">"$1;print $2}' >new.genome.fa

https://www.biostars.org/p/494201/

上一篇 下一篇

猜你喜欢

热点阅读