SRR数据下载及解压
2023-11-21 本文已影响0人
Yizhe_Lin
(1)下载:Aspera
ascp -vQT -l 500m -P33001 -k 1 -i \
~/miniconda3/envs/ascp/etc/asperaweb_id_dsa.openssh era-fasp@${id} .
###
-v 详细模式;-Q 用于自适应流量控制,磁盘限制所需;-T 设置为无需加密传输;-l 最大下载速度;
-P TCP 端口,设置固定值33001;-k 断点续传;-i 免密下载的密钥文件(此处通过which ascp 查询秘钥文件位置)
era-fasp@后接SRR下载地址,从EBI(https://www.ebi.ac.uk/ena/browser/home)获取。
(2)解压
若EBI直接提供双端(_1, _2)的SRR地址,则无需此步骤。
否则,首先试用pfastq-dump
尝试解压,该程序可直接压缩sra文件分解开的两个fq,获得fq.gz。
pfastq-dump --gzip --split-files -t 10 $id
#-t 线程
若不成功,再使用fasterq-dump
多线程解压。但该程序不能直接压缩。
fasterq-dump --split-files -e 24 $id
#-e 线程
gzip -c file.fq >file.fq.gz
参考资料:
[1] 生信工具1: SRAToolkit:https://www.jianshu.com/p/7022f368554b
[2] Aspera——碾压prefetch命令的存在, 利用SRR号批量高效下载FASTQ或SRA数据:https://www.jianshu.com/p/36dc29ae0ed9