samtools统计fasta文件序列长度,根据序列名提取序列
2020-07-17 本文已影响0人
小明的数据分析笔记本
参考
https://www.cnblogs.com/xudongliang/p/5200655.html
使用命令
samtools faidx input.fasta
会生成一个input.fasta.fai的文件,文件的内容总共有5列
第一列是序列名,第二列是序列长度,第四列是每行多少个碱基
根据序列名提取序列
这里好像只能提取单条序列
samtools faidx input.fasta TCONS_00000018 > TCONS_00000018.fa
还可以加上指定的位置
samtools faidx input.fasta TCONS_00000018:1-10
>TCONS_00000018:1-10
TGGGCGAACG