基因组注释--重复序列注释(四):LTR_Finder安装与使用
前言
LTR_Finder是一款常见的LTR预测软件,目前已不再更新维护,小编接下来简单介绍该软件的安装与使用
下载安装
wget https://github.com/xzhub/LTR_Finder/blob/master/build/LTR_FINDER.x86_64-1.0.7.tar.gz
tar -pzxvf LTR_FINDER.x86_64-1.0.7.tar.gz #解压后可以直接使用
参数说明
./ltr_finder -h 可以查看详细的参数说明,小编这里说明几个重要参数的说明
-o Gap开罚分 (正整数),默认3
-t Gap延伸罚分 (正整数),默认1
-e Gap终点罚分 (正整数),默认1
-m Match得分 (正整数),默认2
-u unmatch得分 (负整数),默认-2
-D 5'和3'LTR之间的最大距离 (正整数),默认20000
-d 5'和3'LTR之间的最小距离 (正整数),默认1000
-L 最大5'和3'LTR长度 (正整数),默认3500
-l 最小5'和3'LTR长度 (正整数),默认100
-g joined pairs间最大Gap (正整数),默认50
-G RT子域之间的最大间隔(正整数),默认2
-p 完全匹配的最小长度 (正整数),默认20
-r 用于PBS检测的最小匹配长度 (正整数):默认14, [1,18]
-s 通过使用哪个tRNA数据库来预测PBS (文件名)
-a 使用ps_scan预测(目录名)
-S 输出分数阈值 (整数),默认6.00, [0,10]
-B 清晰度较高阈值 (0到1之间的小数),默认0.400, [0,1]
-b 清晰度较低阈值 (0和1之间的小数),默认0.400, [0,1]
-w 输出格式 (0,1或2),[0]-full, 1-summary, 2-table
-O 输出文件对齐方式长度的长度 (正整数),默认40
-C 自动遮罩高度重复的区域
-F 信号状态控制 (01字符串),默认0:10000000000 5'-LTR must have TG
01000000000 5'-LTR must have CA
00100000000 3'-LTR must have TG
00010000000 3'-LTR must have CA
00001000000 TSR must be found
00000100000 PBS must be found
00000010000 PPT must be found
00000001000 RT domain muse be found
00000000100 Integrase core must be found
00000000010 Integrase c-term must be found
00000000001 RNase H must be found
示例
./ltr_finder -C -w 2 -s eukaryotic-tRNAs.fa genome.fa 1> ./genome.fa.ltr_finder 2>./genome.fa.log #-s指定了真核生物的tRNA数据库,下载链接http://lowelab.ucsc.edu/GtRNAdb/download.html