三代测序技术

samtools统计fasta文件序列长度,根据序列名提取序列

2020-07-17  本文已影响0人  小明的数据分析笔记本
参考

https://www.cnblogs.com/xudongliang/p/5200655.html

使用命令

samtools faidx input.fasta

会生成一个input.fasta.fai的文件,文件的内容总共有5列
第一列是序列名,第二列是序列长度,第四列是每行多少个碱基

根据序列名提取序列
这里好像只能提取单条序列

samtools faidx input.fasta TCONS_00000018 > TCONS_00000018.fa

还可以加上指定的位置

samtools faidx input.fasta TCONS_00000018:1-10
>TCONS_00000018:1-10
TGGGCGAACG
上一篇下一篇

猜你喜欢

热点阅读