Trimmomatic使用说明

2018-10-22  本文已影响170人  邱俊辉

Trimmomatic是一个广受欢迎的Tllumina平台数据过滤工具,支持多线程软件有两种模式 SE 和 PE

用法

单末端测序模式

在SE模式下,只有一个输入文件和一个过滤后的输出文件
java -jar [Trimmomatic所在的绝对路径] SE -phred33 [输入文件] [输出文件] [动作1] [动作2]...................

双末端测序模式

在PE模式下,有两个输入文件,正向测序序列和反向测序序列,过滤之后
输出文件有四个 两端序列都保留的为paried 一端序列过滤后被遗弃另一端保留为unparied
java -jar [Trimmomatic的绝对路径] PE -phred33
第一个输入文件(forward端)正向端
第二个输入文件(reverse端)反向端
输出文件[forward_paried forward_unpaired reverse_paired reverse_unpaired ] [动作1] [动作2].............

动作说明

ILLUMINACLIP:

过滤reads中的Illumina测序街头和引物序列并决定是否去除反向互补的R1/R2中的R2
参数说明(PE测序要注意最后一个参数,SE最后两个参数不用设置,参数之间用冒号连接)
<接头和引物序列所在位置(Trimmomatic自带在adapters里面,其中TruSeq2为2代测序,TruSeq3为三代测序)> :
<seed搜索允许多少个个碱基错配)>:
<alindrome比对分值阈值为多少>:
<simple clip 比对分值阈值为多少>:
<palindrome模式允许切除的最短接头序列为多少 默认为8bp>:
<palindrome模式去除与R1完全反向的R2>

SLIDINGWINDOW:

从reads的5'端开始,进行滑窗质量过滤,切掉碱基质量平均值低于阈值的滑窗
参数说明:<窗口大小>:<碱基平均质量值阈值>

MAXINFO:

一个自动调整的过滤选项,在保证reads长度的情况下尽量降低测序错误率,最大化reads的使用价值

LEADING:

从reads的开头切除质量低于阈值的碱基

TRAILING:

从reads的末尾切除质量低于阈值的碱基

CROP:

从reads的末尾切掉部分碱基是reads达到指定长度

HEADCROP:

从reads的开头切掉指定数量的碱基

MINLEN:

如果经过剪切后reads的长度低于阈值则丢弃这条reads

AVGQUAL:

如果reads的平均碱基质量值低于阈值则丢弃这条reads

TOPHRED33:

将reads的碱基质量值体系转为phred-33

TOPHRED64:

将reads的碱基质量值体系转化为phred-64

上一篇 下一篇

猜你喜欢

热点阅读