微生物多样性qiime2分析流程(7) 运用blast比对方法对
2020-10-27 本文已影响0人
R语言数据分析指南
前面介绍了如何使用qiime2
训练特征分类器对16s数据进行分类注释,但是由于其占用内存较高,个人电脑难以运行,现在介绍如何利用blast
比对的方法进行数据注释。
参考:http://qiime.org/scripts/assign_taxonomy.html
目前qiime2使用频率已经很高了,但是qiime1仍然拥有大批的用户,现在我们使用qiime1里面的Assign_taxonomy.py脚本进行数据注释
1.安装qiime1
conda create -n qiime1 python=2.7 qiime matplotlib=1.4.3 mock nose -c bioconda
非常的简单,目前qiime2也有类似的安装方法,如下所示:
conda install -c qiime2/label/r2020.8 qiime2
2. 激活qiime1
(也可以将qiime1的路径 写入.bashrc
就不用再进行激活,但牢记qiime1为python 2版本
source activate qiime1
3. 进行数据注释
3.1 下载Silva138 数据
良心的qiime2团队已经给我们提供了处理好的数据
https://docs.qiime2.org/2020.8/data-resources/
Silva138 SSURef NR99全长序列:(https://data.qiime2.org/2020.8/common/silva-138-99-seqs.qza)
Silva138 SSURef NR99全长分类学:(https://data.qiime2.org/2020.8/common/silva-138-99-tax.qza)
下载这2组数据即可,之后通过qiime2将序列与注释信息导出
3.2 数据导出
conda activate qiime2-2020.8
mkdir silva-138
qiime tools export --input-path silva-138-99-tax.qza --output-path silva-138
qiime tools export --input-path silva-138-99-seqs.qza --output-path silva-138
执行以上代码我们将得到如下文件:
dna-sequences.fasta
taxonomy.tsv
3.3 数据注释
运用assign_taxonomy.py
进行数据注释
assign_taxonomy.py -m uclust \
-i asv_rep.fasta \
-r dna-sequences.fasta \
-t taxonomy.tsv -o taxonomy > tax.log
通过以上的命令得到了注释结果,就可以继续进行后续分析
参考qiime1的优秀脚本清单:http://qiime.org/scripts/index.html