SRAtoolkits: fastq-dump
2023-05-08 本文已影响0人
LET149
将下载的SRA文件转换成fastq或者fasta文件
1. 普通双端拆分
fastq-dump --split-files filename.sra
将SRA文件转换成R1和R2两个fastq文件,R1是Barcode+UMI,R2是RNA序列
2. 普通单端拆分
fastq-dump --split-3 filename.sra
3. 以.gz格式保存fastq文件
fastq-dump --gzip --split-files
4. 报错及解决
4.1 报错一
Rejected 20042 READS because READLEN < 1
.sra文件中其中有些read的长度为0,而在拆分.sra文件时会有一个-M的参数设置,这个参数规定了read的最少length,默认参数为1;在-M为默认参数下,length为0的read会被去除,单端测序在这种情况下只会减少一些数据量,其他没有影响;双端测序在这种情况下由于两端测序数据中length为0的read不一样,从而导致双端测序read不能对齐,导致下游数据分析失败
- 解决方案:添加
-M 0参数
- 解决效果:长度为
0的行被保存,@开头和+开头行与其他read相同,序列行和测序质量行依然存在,不过没有任何值