MetaPhlAn2
2019-08-16 本文已影响83人
Thinkando
MetaPhlAn是利用宏基因组测序数据对菌群进行定性和定量分析的工具,其基本思想是:首先,根据已有数据库的序列信息形成每个物种独特的marker;然后,将测序read与marker进行比对,从而确定菌群的物种组成;最后,基于比对上的read数和marker长度计算得到标准化后的物种丰度信息。MetaPhlAn2在MetaPhlAn1基础上进行了更新,包括:扩充了物种的基因组数据,覆盖了大约17000的参考基因组大约1M的marker基因;加快比对速度,使用bowtie2对reads和marker进行比对。
主页:http://segatalab.cibio.unitn.it/tools/metaphlan2/
MetaPhlAn2-增强版宏基因组分类谱工具-一条命令获得宏基因组物种组成
https://bitbucket.org/biobakery/biobakery/wiki/metaphlan2
- 下载六个脚本
- SRS014476-Supragingival_plaque.fasta.gz
- SRS014494-Posterior_fornix.fasta.gz
- SRS014459-Stool.fasta.gz
- SRS014464-Anterior_nares.fasta.gz
- SRS014470-Tongue_dorsum.fasta.gz
- SRS014472-Buccal_mucosa.fasta.gz
- 运行
# nproc 多线程
for f in SRS*.fasta.gz;do metaphlan2.py $f --input_type fasta \
--nproc 4 > ${f%.fasta.gz}_profile.txt;done
- 合并
merge_metaphlan_tables.py *_profile.txt> merged_abundance_table.txt
- 画热图
# 运行以下命令以创建仅物种丰度表
# 把 S_前面的去掉
grep -E "(s__)|(^ID)" merged_abundance_table.txt | grep -v "t__" | sed 's/^.*s__//g' > merged_abundance_table_species.txt
# 画热图
# 选择前25个特征
# 使用braycurtis 算法
# 单元格的宽度/高度之间的比率设置为0.5
# 使用对数刻度,将样本和特征标签大小设置为6,将最大样本和特征标签长度设置为100,
# 选择要显示为0.1的最小值,并选择300的图像分辨率。
hclust2.py -i merged_abundance_table_species.txt -o abundance_heatmap_species.png \
--ftop 25 --f_dist_f braycurtis --s_dist_f braycurtis --cell_aspect_ratio 0.5 -l --flabel_size 6 \
--slabel_size 6 --max_flabel_len 100 --max_slabel_len 100 --minv 0.1 --dpi 300 -c Blues

5.1 创建GraPhlAn输入文件
- GraPhlAn需要两个输入:(i)表示树结构和(ii)树的图形注释选项。
# 跳过第一第二行
# 选择100 丰度最大的
# 设置要注释的进化枝的最小丰度阈值,提取至少10个生物标记,选择分类水平5和6进行注释树,
# 选择要在外部图例中使用的分类级别7,并将注释为生物标记的进化枝的最小大小设置为1.
# 创建的输出文件是merged_abundance.tree.txt和merged_abunance.annot.txt。
export2graphlan.py --skip_rows 1,2 -i merged_abundance_table.txt --tree \
merged_abundance.tree.txt --annotation merged_abundance.annot.txt \
--most_abundant 100 --abundance_threshold 1 --least_biomarkers 10 \
--annotations 5,6 --external_annotations 7 --min_clade_size 1
5.2 创建一个分支图
# 第一个命令从树和注释输入创建一个xml文件。第二个命令创建图像,将图像分辨率设置为300并请求外部图例。
graphlan_annotate.py --annot merged_abundance.annot.txt merged_abundance.tree.txt merged_abundance.xml
graphlan.py --dpi 300 merged_abundance.xml merged_abundance.png --external_legends


