samtools faidx

2024-04-04  本文已影响0人  球果假水晶蓝

samtools faidx 是一个建索引的命令,那为什么要给参考基因组建索引呢?

想象一下你有一本非常厚的书,但这本书没有目录。如果我让你找到某一个特定的章节,你可能需要从头到尾翻阅整本书,这非常耗时。如果这本书有一个详细的目录,你可以很快查到那个章节的页码,直接翻到那一页,这就是索引的作用。
以这个序列为例

$ cat 111.fa
>11
AAAAA
>222
AAAAAA
AAAA
>333
AAAA
$ samtools faidx 111.fa

111.fa.fai 第一列是序列ID, 第二列是序列长度,第三列是序列在文件的位置(单位字符),第四列是序列字符数(一行),第五列是序列字符数加换行符(第一行)。


image.png
上一篇 下一篇

猜你喜欢

热点阅读