qiime2完成16s微生物组cleandata数据处理
2021-12-20 本文已影响0人
不愧是你_a
1.创建工作目录,在工作目录下存放公司处理完成的 cleandata 数据
图12.在 cleandata的目录下添加样本单 manifest.txt,里面存放样本名和样本绝对路径
图23.在工作目录下创建mapping文件,命名为sample-metadata.tsv
具体格式如下所示,红色框出来的是必须要有的列名
4.在工作目录下使用命令导入数据
mkdir demux
cd cleandata
qiime tools import \
--type 'SampleData[SequencesWithQuality]' \
--input-path manifest.txt \
--output-path ../demux/single-end-demux.qza \
--input-format SingleEndFastqManifestPhred33V2
cd ..
将single-end-demux.qza文件转换为可视化文件
qiime demux summarize \
--i-data demux/single-end-demux.qza \
--o-visualization demux/single-end-demux.qzv
5.使用dada2生成特征表和特征序列
(由于导入的是公司过滤后的cleandata,故不需要再次过滤)
mkdir dada2
qiime dada2 denoise-single \
--i-demultiplexed-seqs demux/single-end-demux.qza \
--p-trim-left 0 \
--p-trunc-len 0 \
--o-representative-sequences dada2/rep-seqs.qza \
--o-table dada2/table.qza \
--o-denoising-stats dada2/stats.qza
6.特征表可视化
qiime feature-table summarize \
--i-table dada2/table.qza \
--o-visualization dada2/table.qzv \
--m-sample-metadata-file sample-metadata.tsv
7.分类注释
1)下载分类器
mkdir classifier
cd classifier
wget https://data.qiime2.org/2021.11/common/silva-138-99-nb-classifier.qza
cd ..
2)注释
mkdir taxonomy
qiime feature-classifier classify-sklearn \
--i-classifier classifier/silva-138-99-nb-classifier.qza \
--i-reads dada2/rep-seqs.qza \
--o-classification taxonomy/taxonomy-dada2-sliva.qza
8.过滤特征表
1)过滤稀有ASV
mkdir filtered_table
qiime feature-table filter-features \
--i-table dada2/table.qza \
--p-min-frequency 10 \
--o-filtered-table filtered_table/table_filter_low_freq.qza
2)过滤线粒体和叶绿体
qiime taxa filter-table \
--i-table filtered_table/table_filter_low_freq.qza \
--i-taxonomy taxonomy/taxonomy-dada2-sliva.qza \
--p-exclude mitochondria,chloroplast \
--o-filtered-table filtered_table/table_filter_low_freq_contam.qza
3)可视化过滤了稀有ASV、线粒体和叶绿体的特征表
qiime feature-table summarize \
--i-table filtered_table/table_filter_low_freq_contam.qza \
--o-visualization filtered_table/table_filter_low_freq_contam_summary.qzv
4)过滤有较少的ASV总量的sample
qiime feature-table filter-samples \
--i-table filtered_table/table_filter_low_freq_contam.qza \
--p-min-frequency 29000 \
--o-filtered-table filtered_table/final_table.qza
5)更新特征序列
mkdir filtered_rep_seqs
qiime feature-table filter-seqs \
--i-data dada2/rep-seqs.qza \
--i-table filtered_table/final_table.qza \
--o-filtered-data filtered_rep_seqs/final_rep_seqs.qza
6)重新注释
qiime feature-classifier classify-sklearn \
--i-classifier classifier/silva-138-99-nb-classifier.qza \
--i-reads filtered_rep_seqs/final_rep_seqs.qza \
--o-classification taxonomy/final_taxonomy_sliva.qza
7)可视化最终的特征表
qiime feature-table summarize \
--i-table filtered_table/final_table.qza \
--o-visualization filtered_table/final_table.qzv
8)核心特征
qiime feature-table core-features \
--i-table filtered_table/final_table.qza \
--p-min-fraction 0.6 \
--p-max-fraction 1 \
--p-steps 11 \
--o-visualization filtered_table/final_table_cores.qzv