2020-06-19 Fastp官方教程学习笔记
2020-06-19 本文已影响0人
热爱大自然的小和尚
Fastp官方教程学习笔记
资源
输入和输出参数
- 单端:
-i -o
- 双端:
-i -I -o -O
- 如果不指定-o,则对QC前后的序列文件进行质检报告,但是没有输出文件
-
-o
如果以gz
结尾,则对输出文件进行压缩等级为4的zip压缩 -
--unpaired1
和--unpaired2
指定的是未配对的文件,如果两个文件的名称相同,则将未配对的read输出到一个文件 -
--failed_out
可以指定未通过QC的read -
--read_to_process
仅仅处理部分read --dont_overwrite
Filtering
- 质量
-
-n
指定N的数目最多为多少个 -
-q
指定好read的phred值 -
-u
指定不合格的read的最大的百分比 -
-e
指定average的phread值
-
- 长度:
-
-l
read的长度不短于该值的时候保留 -
--length_limit
read不长于
-
- complexity:
-
-Y
默认为30%,即相邻的碱基必须至少30%是不同的
-
Adapter
-
-a
指定adapter的序列 - 对于双端测序数据来说,一般不用指定adapter序列,软件可以自动识别
- 利用
--detecet_adapter_for_pe
打开自动识别adapter的功能 - 软件有给出常用的adapter序列,在帮助文件里面有提到
--adapter_fasta
- ==先trimauto_detect_adapter或--adapter_seq,在trim--adapter_fasta==
cut模式
- -5
- -3
- -r
miscellaneous
-
--split_prefix_digits
指定把数据分块的prefix -
-s
分块的块数