使用STAR构建基因组索引

2022-04-13 本文已影响0人花生学生信

最近接到一个任务，使用STAR构建基因组索引，需要准备的数据是基因组文件和注释文件。

STAR（Spliced Transcripts Alignments to a Reference，STAR）软件，使用了未压缩后缀阵列中的连续最大可比对种子搜索算法，接着对种子进行聚类和拼接。STAR在比对速度上胜过其他比对软件50多倍，在一个普通的12核服务器上，每小时比对5.5亿2 x 75 bp双端片段到人类基因组上，同时改进了比对敏感性和准确性。除了典型转录本外，STAR能够发现非典型剪切和嵌合（融合）转录本，并能够比对全长RNA序列。

运行脚本：

STAR  \
--runMode genomeGenerate \
--genomeDir index \
--runThreadN 10 \
--genomeFastaFiles  L.genome.fa \
--sjdbGTFfile L.gff \

参数说明：
--runThreadN：线程数。
--runMode genomeGenerate：构建基因组索引。
--genomeDir：索引目录。
--genomeFastaFiles：基因组文件。
--sjdbGTFfile：基因组注释文件。
--sjdbOverhang：reads长度减1。

成功运行

生成结果文件

参考：
STAR建立索引 - 简书 (jianshu.com)

使用STAR构建基因组索引

猜你喜欢

热点阅读