蛋白三级结构预测(I TASSER)
2020-06-23 本文已影响0人
落寞的橙子
献给初学者:手把手教你在线预测蛋白质结构
I TASSER算是比较好的华人教授开发的一个预测软件,在线可以直接分析。但是需要等待挺长时间并且一次只能run一个。所幸我们HPC上有这个软件所以我就直接run起来代码如下。
先将RNA序列用CPC2预测下氨基酸序列,当然也可以下已知的氨基酸序列,存储为fasta格式,我上批量运行的所以直接就批量递交了,大家参考即可。
#!/bin/bash
#SBATCH --time=1:00:00
#SBATCH --cpus-per-task=2
#SBATCH --mem=2g
data_dir=/I_TASSER
fa_dir=${data_dir}/fasta_files
job_dir=${data_dir}/job
log_dir=${data_dir}/log
mkdir -p ${log_dir}
mkdir -p ${job_dir}
thread=14
cd ${fa_dir}
for i in $(ls $pwd *.fa);do
job_file="${job_dir}/${i%.fa*}.job"
echo "#!/bin/bash
#SBATCH --job-name=${i%.fa*}.I-TASSER.job
#SBATCH --output=$log_dir/${i%.fa*}.I-TASSER.out
#SBATCH --time=40:00:00
#SBATCH --cpus-per-task=${thread}
#SBATCH --mem=30g
module load I-TASSER
out_dir=${fa_dir}/${i%.fa*}
mkdir -p \${out_dir}
runI-TASSER.pl -runstyle gnuparallel \
-LBS true -EC true -GO true -seqname ${i%.fa*} \
-datadir \${out_dir} -light true \
-outdir \${out_dir} && file2html.py \${out_dir}
" > $job_file
sbatch $job_file
done