linux基因组

3:数据并行处理:sra转成fq文件

2019-05-26  本文已影响64人  Y大宽

总目录:三阴性乳腺癌全外显子分析(wes)


生信技能树已经很贴心地把sra格式数据全部下载。共5.3个T。存放在

/data/fudan_TNBC/

查看共多少样本

(base) pc@pc-System-Product-Name:/data/fudan_TNBC$ ls -l |grep "^-"|wc -l
727

/data/fudan_TNBC/下的sra文件转成fastq文件,并存放在/project/raw_fq/

cd /project/raw_fq/
for id in `seq 8223 8454`; do nohup sudo  fastq-dump --gzip --split-3 /data/fudan_TNBC/SRR851${id}.sra . & ;done
nohup for id in `seq 854 999`; do  nohup sudo fastq-dump --gzip --split-3 /data/fudan_TNBC/SRR8517{id}.sra -O . &; done
for ((i=854;i<=999;i++));do nohup sudo fastq-dump --gzip --split-3 -A SRR35899$i.sra -O .&;done 

raw_fq共5.3T,分批进行处理。
实际是,因为机房停电,很多文件没有转换完整。然后最后直接分两批转完了,共占用5.8T空间。

这一步前后用了一个周,除去开始转换太多爆内存和后期机房停电,实际转换大概需要60小时即可。

for id in `seq 660 702`; do    nohup sudo  fastq-dump --gzip --split-3 /data/fudan_TNBC/SRR8707${id}.sra . & done
上一篇下一篇

猜你喜欢

热点阅读