生信linux生信软件

SRAtoolkits: fastq-dump

2023-05-08  本文已影响0人  LET149

将下载的SRA文件转换成fastq或者fasta文件

1. 普通双端拆分

fastq-dump --split-files filename.sra

将SRA文件转换成R1和R2两个fastq文件,R1是Barcode+UMI,R2是RNA序列

2. 普通单端拆分

fastq-dump --split-3 filename.sra

3. 以.gz格式保存fastq文件

fastq-dump --gzip --split-files

4. 报错及解决

4.1 报错一

Rejected 20042 READS because READLEN < 1
.sra文件中其中有些read的长度为0,而在拆分.sra文件时会有一个-M的参数设置,这个参数规定了read的最少length,默认参数为1;在-M为默认参数下,length0read会被去除,单端测序在这种情况下只会减少一些数据量,其他没有影响;双端测序在这种情况下由于两端测序数据中length0read不一样,从而导致双端测序read不能对齐,导致下游数据分析失败

    1. 解决方案:添加 -M 0参数
    1. 解决效果:长度为0的行被保存,@开头和+开头行与其他read相同,序列行测序质量行依然存在,不过没有任何值
上一篇下一篇

猜你喜欢

热点阅读