fastq-dump从SRA文件中提取fastq文件
2018-10-16 本文已影响28人
晓明_再出发
fastq-dump是SRAtoolkit中使用频率很高的命令,用于从SRA文件中拆解提取fastq文件。具体用法如下:
Usage:
fastq-dump [options] <path> [<path>...]
fastq-dump [options] <accession>
Use option --help for more information
一. 拆解一个sra文件
cd ~/Seqs
fastq-dump --split-files SRR6232298.sra
- SRR6232298.sra是一个PE测序结果,所以,需要--split-files参数可以将其分解为两个fastq文件。
- 如果不加该参数,则只有1个fastq文件(包含了两端测序的结果)
二.批量拆解sra文件
1. 新建脚本文件
nano fqdump.sh
2. 输入以下脚本
#!/bin/sh
for i in *sra
do
echo $i
fastq-dump --gzip --split-files $i
done
Ctrl+O; Ctrl+X保存退出。
**这里--gzip参数是为了生成压缩的gz格式fastq文件,以节省磁盘空间
3. 运行脚本
sh fqdump.sh
image.png
详细说明请参加官方Documentation
https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=toolkit_doc&f=fastq-dump
以及hiptop的简书文章:
https://www.jianshu.com/p/a8d70b66794c