SRR数据下载及解压

2023-11-21  本文已影响0人  Yizhe_Lin

(1)下载:Aspera

ascp  -vQT -l 500m -P33001 -k 1 -i  \
~/miniconda3/envs/ascp/etc/asperaweb_id_dsa.openssh era-fasp@${id} .
###
-v 详细模式;-Q 用于自适应流量控制,磁盘限制所需;-T 设置为无需加密传输;-l 最大下载速度;
-P TCP 端口,设置固定值33001;-k 断点续传;-i 免密下载的密钥文件(此处通过which ascp 查询秘钥文件位置)

  era-fasp@后接SRR下载地址,从EBI(https://www.ebi.ac.uk/ena/browser/home)获取。

(2)解压
  若EBI直接提供双端(_1, _2)的SRR地址,则无需此步骤。
  否则,首先试用pfastq-dump尝试解压,该程序可直接压缩sra文件分解开的两个fq,获得fq.gz。

pfastq-dump --gzip --split-files -t 10  $id
#-t 线程

  若不成功,再使用fasterq-dump多线程解压。但该程序不能直接压缩。

fasterq-dump --split-files -e 24  $id
#-e 线程
gzip -c file.fq >file.fq.gz

参考资料:
[1] 生信工具1: SRAToolkit:https://www.jianshu.com/p/7022f368554b
[2] Aspera——碾压prefetch命令的存在, 利用SRR号批量高效下载FASTQ或SRA数据:https://www.jianshu.com/p/36dc29ae0ed9

上一篇下一篇

猜你喜欢

热点阅读