基因组学

PhyloPhlAn3系统进化分析

2021-08-31  本文已影响0人  胡童远

PhyloPhlAn3.0:https://huttenhower.sph.harvard.edu/phylophlan
GitHub:https://github.com/biobakery/phylophlan

一、安装:

conda install -c bioconda phylophlan=3.0

失败

conda create -n python3.7 -c bioconda python=3.7  #创建新的环境
conda activate python3.7  # 进入环境
conda install phylophlan=3.0  # 安装
phylophlan --version  # 检查
# PhyloPhlAn version 3.0.51 (11 May 2020)
# PhyloPhlAn version 3.0.60 (27 November 2020)

成功

另外安装metaphlan3时会安装phyliphlan3作为依赖。

conda create -n metaphlan python=3.7
conda activate metaphlan
conda install tbb=2020.2
conda install bowtie2
conda install -c bioconda metaphlan
phylophlan --version
# PhyloPhlAn version 3.0.60 (27 November 2020)

成功

二、获取数据库

phylophlan有自己的数据库,也支持自建数据库。

地址:http://cmprod1.cibio.unitn.it/databases/PhyloPhlAn/phylophlan_databases.txt

#database_name  database_url    database_md5
amphora2    
http://cmprod1.cibio.unitn.it/databases/PhyloPhlAn/amphora2.tar 
http://cmprod1.cibio.unitn.it/databases/PhyloPhlAn/amphora2.md5
#amphora2   https://zenodo.org/record/4005745/files/amphora2.tar?download=1 https://zenodo.org/record/4005745/files/amphora2.md5?download=1
phylophlan  
http://cmprod1.cibio.unitn.it/databases/PhyloPhlAn/phylophlan.tar   
http://cmprod1.cibio.unitn.it/databases/PhyloPhlAn/phylophlan.md5
#phylophlan https://zenodo.org/record/4005620/files/phylophlan.tar?download=1   https://zenodo.org/record/4005620/files/phylophlan.md5?download=1

linux bad connection, win下载tar压缩文件:

# md5编号
587698f1b8593daba2719d587ba43463  amphora2.tar
9b3ce73a1d4808620161c27d7a739b48  phylophlan.tar
# 验证md5,不报错就是没错
diff <(md5sum amphora2.tar) amphora2.md5
diff <(md5sum phylophlan.tar) phylophlan.md5

悄悄改一个编号会被发现,测试diff的使用,

解压

tar -xf amphora2.tar # 解压文件夹
bzcat amphora2/*.bz2 > amphora2/amphora2.faa # 解压合并文件

amphora一共136个marker gene,合并到一个faa蛋白序列文件

tar -xf phylophlan.tar # 解压文件夹
bunzip2 -k phylophlan/phylophlan.faa.bz2

phylophlan只有一个蛋白序列文件,34万条蛋白序列,

最后清除所有压缩文件。

三、建数据库索引

diamond索引

diamond makedb --in amphora2/amphora2.faa --db amphora2/amphora2
diamond makedb --in phylophlan/phylophlan.faa --db phylophlan/phylophlan

四、Tutorials

案例教程:https://github.com/biobakery/biobakery/wiki/PhyloPhlAn3

第一张热图显示在埃塞俄比亚人群中发现的前21个 SGB 的存在/缺失情况;第二张热图显示每个宏基因组样本中有多少 uSGBs (unknown)、 kSGBs (known) 和未分配的分箱。

参考:
PhyloPhlAn 3.0 微生物组系统发育分析

上一篇 下一篇

猜你喜欢

热点阅读