数据分析

SqueezeMeta使用教程

2020-04-23  本文已影响0人  kkkkkkang

SqueezeMeta是一个全自动的宏基因组数据处理流程,涵盖了组装、分箱、物种注释、功能注释以及各个样品具有的物种和功能丰度信息还有后续可视化等等。以往这些你都需要单独写脚本计算,每一步都很耗神费时......

SqueezeMeta简介

SqueezeMeta是用于宏基因组学/宏转录组学的全自动流程,涵盖了分析的所有步骤。 SqueezeMeta包含多元基因组支持,允许相关元基因组的共同组装以及通过分箱程序提取单个基因组。 因此,SqueezeMeta具有几个独特的特征:

SqueezeMeta可以在三种不同的模式下运行:

###下面是步骤总结

steps.jpg

此处我只写一下自己使用的流程及遇到的坑,帮助后来的小伙伴快速掌握这个软件的使用流程。
想了解更多的童鞋请点击原文章链接

安装: 这里我选择简单无脑版—conda

conda create -n SqueezeMeta -c bioconda -c fpusan squeezemeta
conda activate SqueezeMeta

数据库下载,耗费了一个多星期才搞好o_O.

1.下载下面三个文件
https://saco.csic.es/index.php/s/RKQNjYYHWGn6Z3W
https://saco.csic.es/index.php/s/s8S9xosiLKMeMJT
https://saco.csic.es/index.php/s/kLtH4gFJNJTX4ed

2. SqueezeMetaDB.tar.gz文件稍大,记得检查完整
它的md5sum值:2d02374c7053a625bb7fc47aa85b839d.
把classifier.tar.gz 复制(注意是复制)到 SqueezeMeta/lib 文件夹 (我这里是 ~/miniconda2/envs/SqueezeMeta/SqueezeMeta/lib/)不要解压classifier.tar.gz. 
解压 "SqueezeMetaDB.tar.gz" 和 "test.tar.gz" 到你想放置数据库的地方,暂且称作/path/to/SQMdata/

3. 现在应该有 /path/to/SQMdata/db 和 /path/to/SQMdata/test.
/path/to/SQMdata/db 文件夹有很多文件,其中包括 nr.dmnd.

4. 运行configure_nodb.pl /path/to/SQMdata/db. 
会报error 500错误,没有影响
最后测试一下是否配置成功:test_install.pl 所有都OK就是好了

5. 最后注意一下, 解压 classifier.tar.gz 为 classifier ,然后把它放到安装的库中(我这里是~/miniconda2/envs/SqueezeMeta/SqueezeMeta/lib/) 
因为运行完 configure_nodb.pl, ~/miniconda2/envs/SqueezeMeta/SqueezeMeta/lib/classifier 被删了,然后你再跑后面的会报错,提示找不到相关脚本,其实就是含有脚本的文件夹被删了

下面就是一些常规计算流程,有些小坑我已经写出来了

首先你需要准备一个sample文件,告诉系统你的原始数据在哪里。
第一列是你最终要使用的样品名称,第二列是真正的样品名称,第三列pair1和pair2表示正和反向测序的序列

sample
#BSUB -J squeezemeta_PZH
#BSUB -n 32
#BSUB -R span[hosts=1]
#BSUB -o squeezemeta_PZH.out
#BSUB -e squeezemeta_PZH.err
#BSUB -q smp
source activate SqueezeMeta
cd /public/home/jkyin/yjk/PZH_meta/squeezemeta/
SqueezeMeta.pl -m coassembly -p PZH -s sample.txt -f ../raw/ -t 32
#BSUB -J squeezemeta_PZH_restart1
#BSUB -n 32
#BSUB -R span[hosts=1]
#BSUB -o squeezemeta_PZH_restart1.out
#BSUB -e squeezemeta_PZH_restart1.err
#BSUB -q smp
source activate SqueezeMeta
cd /public/home/jkyin/yjk/PZH_meta/squeezemeta/
restart.pl PZH
#BSUB -J squeezemeta_PZH_restart1
#BSUB -n 32
#BSUB -R span[hosts=1]
#BSUB -o squeezemeta_PZH_restart1.out
#BSUB -e squeezemeta_PZH_restart1.err
#BSUB -q normal
source activate SqueezeMeta
cd /public/home/jkyin/yjk/PZH_meta/squeezemeta/
restart.pl PZH
#BSUB -J squeezemeta_PZH_restart1
#BSUB -n 32
#BSUB -R span[hosts=1]
#BSUB -o squeezemeta_PZH_restart1.out
#BSUB -e squeezemeta_PZH_restart1.err
#BSUB -q smp
source activate SqueezeMeta
cd /public/home/jkyin/yjk/PZH_meta/squeezemeta/
restart.pl PZH
#先切到项目文件存在的目录
(base) [jkyin@mn02 squeezemeta]$ pwd
/public/home/jkyin/yjk/PZH_meta/squeezemeta
(base) [jkyin@mn02 squeezemeta]$ ll
total 1
drwxr-xr-x 7 jkyin LFRuan 4096 Apr 23 10:27 PZH
-rw-r--r-- 1 jkyin LFRuan  529 Mar  9 16:37 sample.txt
#然后比如要运行步骤4
(base) [jkyin@mn02 squeezemeta]$~/miniconda3/envs/SqueezeMeta/SqueezeMeta/scripts/04.rundiamond.pl PZH
restart.pl -step 4 /path/to/your/project

下游分析及可视化

选择1:在R中分析
可以把项目文件夹中的SqueezeMeta_conf.pl、intermediate和results下载到本地分析
不然,在服务器上,你每次退出R的时候,花大半小时加载的项目文件对象就会消失。反正我还是觉得本地Rstudio顺手

把~/miniconda3/envs/SqueezeMeta/lib/R/library/SQMtools这个文件夹下载到本地,不要搞错了。
千万不要搞成/miniconda3/envs/SqueezeMeta/SqueezeMeta/lib/SQMtools这个了,不然你死活都安装不上的😪
压缩为.zip结尾的文件
本地安装就可以了

下面可以去看作者给出的例子,很详细

R统计分析和可视化

还可以利用anvio可视化,作者同样给出了很好的例子

上一篇下一篇

猜你喜欢

热点阅读