2020-07-27 批量SRA转fastq

2020-07-26  本文已影响0人  小桃学生信

来源:
https://www.jianshu.com/p/7804e9636bcb
【轩哥传授】

进入需要提取文件名的目录下

(wes) [somebody@HPC-login sra]$ for i in * .sra;do basename $i .sra;done > id.txt
(wes) [somebody@HPC-login sra]$ head id.txt

准备以下3个文件

(wes) [somebody@HPC-login sra2fastq]$ ls
id.csv  mappfile  temple.pbs

查看一下三个文件的内容:

(wes) [somebody@HPC-login sra2fastq]$ head id.csv
SRR6359386.sra
SRR6359387.sra
SRR6359388.sra
SRR6359389.sra
SRR6359390.sra
SRR6359391.sra
SRR6359392.sra
SRR6359393.sra
SRR6359394.sra
SRR6359395.sra
(wes) [somebody@HPC-login sra2fastq]$ head mappfile
<sample>,0
(wes) [somebody@HPC-login sra2fastq]$ cat temple.pbs
#PBS -N fastq_<sample>
#PBS -l nodes=1:ppn=1
#PBS -l walltime=20:00:00
#PBS -l mem=10gb
#PBS -S /bin/bash
#PBS -q normal_3
#PBS -j oe

source activate wes
workdir=/public/home/somebody/ncbi/dbGaP-22002
cd $workdir
fastq-dump -outdir fastq_gz --split-3 --skip-technical --clip --gzip $workdir/sra/<sample>

开始批量生成

$ sync-qgen -f temple.pbs -m mappfile -s id.csv -d .

循环提交同一个文件夹下的文件

for i in /public/home/somebody/biodata/gdc/links/sequence-nsclc/step_4/script/tcgapaired/*pbs
do qsub $i
done

遇到的报错:

比如下图中-outdir用法应该是--outdir,pbs的输出文件中显示的都是该工具--help内容,说明工具在使用过程中用错了.

批量删除提交的任务

中途发现模板pbs文件出现问题,于是需要批量取消服务器上的任务从1811964到1812178,任务ID号qstat即可看到

$ qdel {1811964..1812178}

删除这个用户提交的所有pbs任务(谨慎一点特别是大家共用账号咧)

$ qdel -u [username]
上一篇 下一篇

猜你喜欢

热点阅读