生物信息分析

Trimmomatic与Trim_galore比较

2022-01-22  本文已影响0人  笺牒九州的怪咖

Trimmomatic

优势:

1、可使用参数更多,如滑窗剪切,可以直接选择使用内置的接头序列等等;

2、默认可生成paired和unpaired两种文件,更利于下游分析。

劣势:

1、代码非常长,而且容易写错,最好写在一个脚本里;

2、参数比较难记,像ILLUMINACLIP中的几个数字分别代表什么必须要对照说明书才能看懂;

3、运行时间较长;

4、只适用于illumina测序得到的数据,不适用与其他测序平台。

Trim_galore

优势:

1、安装和使用都非常简单;

2、代码较短

3、参数更直观,不用去死记硬背

4、默认下不区分paired和unpaired,运行速度较快

劣势:

可调参数较少


trim_galore参数:

参数说明:

--quality:设定Phred quality score阈值,默认为20。

--phred33::选择-phred33或者-phred64,表示测序平台使用的Phred quality score。

--adapter:输入adapter序列。也可以不输入,Trim Galore!会自动寻找可能性最高的平台对应的adapter。自动搜选的平台三个,也直接显式输入这三种平台,即--illumina、--nextera和--small_rna。

--stringency:设定可以忍受的前后adapter重叠的碱基数,默认为1(非常苛刻)。可以适度放宽,因为后一个adapter几乎不可能被测序仪读到。

--length:设定输出reads长度阈值,小于设定值会被抛弃。

--paired:对于双端测序结果,一对reads中,如果有一个被剔除,那么另一个会被同样抛弃,而不管是否达到标准。

--retain_unpaired:对于双端测序结果,一对reads中,如果一个read达到标准,但是对应的另一个要被抛弃,达到标准的read会被单独保存为一个文件。

--gzip和--dont_gzip:清洗后的数据zip打包或者不打包。

--output_dir:输入目录。需要提前建立目录,否则运行会报错。

-- trim-n : 移除read一端的reads

对于单端测序数据,基本用法如下

trim_galore --quality 20 -a AGATCGGAAGAGC --length 20 -o out_dir  input.fq

对于双端测序数据,基本用法如下

trim_galore --paired --quality 20 -a AGATCGGAAGAGC -a2 AGATCGGAAGAGC --length 20 -o out_dir R1.fq.gz R2.fq.gz

也可不指定接头序列,Trim galore是可以自动检测adapter的!

---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------I am  a line !--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

参考链接:https://blog.csdn.net/lazymark2/article/details/119224606

上一篇 下一篇

猜你喜欢

热点阅读