小教程收藏

hisat2-build建立索引所需的SNP文件

2020-05-17  本文已影响0人  生信编程日常

hisat2建立索引的时候支持将SNP的信息考虑进基因组中,在比对的过程中,不会将Alt SNP当做mismatch看待。

hisat2-build -p 8 --snp hisat2_snps.txt  hg19.fasta hisat2_index/

这里对SNP文件的要求是 :(https://ccb.jhu.edu/software/hisat2/manual.shtml#the-hisat2-build-indexer):

这里的格式是:rs58784443 single 13 18447947 T
每一列分别为:SNP ID <tab> snp type (single, deletion, or insertion) <tab> chromosome name <tab> zero-offset based genomic position of a SNP <tab> alternative base (single), the length of SNP (deletion), or insertion sequence (insertion)
第一列是rsID (或者任何唯一的ID标志),第二列是SNP种类(single, deletion, or insertion),第三列是染色体,第四列是位置,第五列是Alt SNP。值得注意的是位置必须是0-based的,即从0开始计数的位置。

欢迎关注!!


上一篇 下一篇

猜你喜欢

热点阅读