微生物16S/宏基因组/代谢组微生物

宏基因组分箱(五)Metawrap计算Bin丰度

2019-10-26  本文已影响0人  胡童远

导读

用Metabat2分箱的方法见:宏基因组分箱(二)Metabat2分箱实战。本篇将展示用Metawrap的quant_bins模块计算每个样品中每个Bin的丰度的方法。quant_bins模块利用salmon软件的算法估计丰度。

一、查看输入文件

  1. 原始数据,即每个样品的质控后的fastq序列。
ls -alh Clean_data/

总用量 105G
drwxrwxr-x  2 cheng WST 4.0K 10月 15 16:45 .
drwxrwxr-x 14 cheng WST 4.0K 10月 23 19:46 ..
-rw-rw-r--  1 cheng WST  11G 10月 15 16:13 H1_1.fastq
-rw-rw-r--  1 cheng WST  11G 10月 15 16:14 H1_2.fastq
-rw-rw-r--  1 cheng WST  13G 10月 15 16:14 H2_1.fastq
-rw-rw-r--  1 cheng WST  13G 10月 15 16:15 H2_2.fastq
-rw-rw-r--  1 cheng WST 5.0G 10月 15 16:15 H3_1.fastq
-rw-rw-r--  1 cheng WST 5.0G 10月 15 16:15 H3_2.fastq
-rw-rw-r--  1 cheng WST  13G 10月 15 16:15 H4_1.fastq
-rw-rw-r--  1 cheng WST  13G 10月 15 16:16 H4_2.fastq
-rw-rw-r--  1 cheng WST  12G 10月 15 16:16 H5_1.fastq
-rw-rw-r--  1 cheng WST  12G 10月 15 16:16 H5_2.fastq


  1. 由Megahit共组装得到的contig文件。
-rw-rw-r--  1 cheng WST   261391061 10月 15 10:42 final.contigs.fa

  1. 有Metabat2分箱得到的bIn文件(分装好的contig文件)。
ls -alh Bin/

总用量 159M
drwxrwxr-x  2 cheng WST 4.0K 10月 24 10:38 .
drwxrwxr-x 14 cheng WST 4.0K 10月 23 19:46 ..
-rw-rw-r--  1 cheng WST 1.5M 10月 15 15:00 bin.10.fa
-rw-rw-r--  1 cheng WST 1.1M 10月 15 15:00 bin.11.fa
-rw-rw-r--  1 cheng WST 1.2M 10月 15 15:00 bin.12.fa
-rw-rw-r--  1 cheng WST 1.2M 10月 15 15:00 bin.13.fa
-rw-rw-r--  1 cheng WST 767K 10月 15 15:00 bin.14.fa
-rw-rw-r--  1 cheng WST 229K 10月 15 15:00 bin.15.fa
...

二、Metawrap计算Bin丰度

source activate metawrap-env
# 进入metawrap工作环境

metawrap quant_bins -t 32 -o Bin_quant/ -b Bin/ -a final.contigs.fa Clean_data/H*.fastq

参数:
-t # 线程
-o # 输出文件夹(自动创建)
-b # Bin所在文件夹
-a # contig组装结果
最后是fastq/a(初始数据)文件所在文件夹

三、丰度计算结果

metawrap quant_bins结果:

ls -alh Bin_quant/
总用量 296K
drwxrwxr-x  4 cheng WST 4.0K 10月 26 15:26 .
drwxrwxr-x 14 cheng WST 4.0K 10月 23 19:46 ..
drwxrwxr-x  2 cheng WST 4.0K 10月 15 17:00 assembly_index
-rw-rw-r--  1 cheng WST 259K 10月 15 17:23 bin_abundance_heatmap.png
-rw-rw-r--  1 cheng WST 9.8K 10月 26 15:26 bin_abundance.pdf
-rw-rw-r--  1 cheng WST 5.0K 10月 15 17:22 bin_abundance_table.tab
drwxrwxr-x  2 cheng WST 4.0K 10月 15 17:22 quant_files

查看每个样品每个Bin的丰度:

less Bin_quant/bin_abundance_table.tab
# 如下:

Genomic bins    H2      H3      H1      H4      H5
bin.89  2.134105        0.893291        0.0     0.028242        0.0
bin.20  41.204144       19.519443       23.791852       36.713749       37.634001
bin.4   0.169901        0.218777        0.120826        0.9935795000000001      0.513861
bin.25  0.0     0.027746        2.670033        0.008831        0.0
bin.22  2.421549        7.251491        12.911376       0.775966        0.826068
bin.6   0.364747        0.120078        3.01643 0.607021        0.401539
bin.59  33.633947500000005      18.263084       20.202049       30.182607       30.293537
bin.68  0.884554        0.7562530000000001      0.036951        0.12255150000000001     0.437777
...

打开bin_abundance_heatmap.png,如下图所示。颜色和纵坐标设置都不好,可以自己用bin_abundance_table.tab文件重新画热图。

图片.png

相关阅读:
宏基因组分箱(一)Megahit组装和QUAST质量评价
宏基因组分箱(二)Metabat2分箱实战
宏基因组分箱(三)Blobology可视化Bin

\color{green}{😀😀原创文章,码字不易,转载请注明出处😀😀}

上一篇 下一篇

猜你喜欢

热点阅读