微生物多样性qiime2分析流程(7) 运用blast比对方法对

2020-10-27 本文已影响0人 R语言数据分析指南

前面介绍了如何使用qiime2训练特征分类器对16s数据进行分类注释，但是由于其占用内存较高，个人电脑难以运行，现在介绍如何利用blast比对的方法进行数据注释。
参考：http://qiime.org/scripts/assign_taxonomy.html

目前qiime2使用频率已经很高了，但是qiime1仍然拥有大批的用户，现在我们使用qiime1里面的Assign_taxonomy.py脚本进行数据注释

1.安装qiime1

conda create -n qiime1 python=2.7 qiime matplotlib=1.4.3 mock nose -c bioconda

非常的简单，目前qiime2也有类似的安装方法，如下所示：

conda install -c qiime2/label/r2020.8 qiime2

2. 激活qiime1

(也可以将qiime1的路径写入.bashrc就不用再进行激活，但牢记qiime1为python 2版本

source activate qiime1

3. 进行数据注释

3.1 下载Silva138 数据

良心的qiime2团队已经给我们提供了处理好的数据
https://docs.qiime2.org/2020.8/data-resources/
Silva138 SSURef NR99全长序列：(https://data.qiime2.org/2020.8/common/silva-138-99-seqs.qza)
Silva138 SSURef NR99全长分类学:(https://data.qiime2.org/2020.8/common/silva-138-99-tax.qza)
下载这2组数据即可,之后通过qiime2将序列与注释信息导出

3.2 数据导出

conda activate qiime2-2020.8
mkdir silva-138
qiime tools export --input-path silva-138-99-tax.qza --output-path silva-138
qiime tools export --input-path silva-138-99-seqs.qza --output-path silva-138

执行以上代码我们将得到如下文件：

dna-sequences.fasta 
taxonomy.tsv

3.3 数据注释

运用assign_taxonomy.py进行数据注释

assign_taxonomy.py -m uclust \
-i asv_rep.fasta \
-r dna-sequences.fasta \
-t taxonomy.tsv -o taxonomy > tax.log

通过以上的命令得到了注释结果，就可以继续进行后续分析
参考qiime1的优秀脚本清单：http://qiime.org/scripts/index.html