Trimmomatic

2022-11-02  本文已影响0人  重拾生活信心

usadellab/Trimmomatic (github.com)

Quick start

单末端测序数据:

trimmomatic SE -phred33 input.fq.gz output.fq.gz \
ILLUMINACLIP:TruSeq3-SE:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:36

双末端测序数据:

trimmomatic PE -phred33 \
input_forward.fq.gz input_reverse.fq.gz \
output_forward_paired.fq.gz output_forward_unpaired.fq.gz \
output_reverse_paired.fq.gz output_reverse_unpaired.fq.gz \
ILLUMINACLIP:TruSeq3-PE.fa:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:36
   *   <input 1> <input 2> <paired output 1> <unpaired output 1> <paired output 2> <unpaired output 2>

       1.  PE 模式的两个输入文件:sample_R1.fastq    sample_R2.fastq
       2.  以及四个输出文件:sample_**paired_**R1.clean.fastq\ sample_**unpaired**_R1.clean.fastq\ sample_paired_R1.clean.fastq\ sample_unpaired_R1.clean.fastq

常用参数:

*   ILLUMINACLIP: 过滤 reads 中的 Illumina 测序接头和引物序列,并决定是否去除反向互补的 R1/R2 中的 R2。
*   SLIDINGWINDOW: 从 reads 的 5' 端开始,进行滑窗质量过滤,切掉碱基质量平均值低于阈值的滑窗。
*   MAXINFO: 一个自动调整的过滤选项,在保证 reads 长度的情况下尽量降低测序错误率,最大化 reads 的使用价值。
*   LEADING: 从 reads 的开头切除质量值低于阈值的碱基。
*   TRAILING: 从 reads 的末尾开始切除质量值低于阈值的碱基。
*   CROP: 从 reads 的末尾切掉部分碱基使得 reads 达到指定长度。
*   HEADCROP: 从 reads 的开头切掉指定数量的碱基。
*   MINLEN: 如果经过剪切后 reads 的长度低于阈值则丢弃这条 reads。
*   AVGQUAL: 如果 reads 的平均碱基质量值低于阈值则丢弃这条 reads。
*   TOPHRED33: 将 reads 的碱基质量值体系转为 phred-33。
*   TOPHRED64: 将 reads 的碱基质量值体系转为 phred-64。

几种reads trimmed 情况

Ref:
Trimmomatic--集能力与才华于一身

上一篇 下一篇

猜你喜欢

热点阅读