Qiime2 (三)-DADA2降噪(Denoise)流程
2020-08-20 本文已影响0人
佳名
Dada 2 流程
DADA2数据处理不以序列相似度聚类,只进行去重(或相当于以100%序列相似度聚类),生成的是以ASV为单元的表格;
Vsearch数据处理与Usearch类似,以序列间相似度聚类(默认序列相似度为97%),生成的是OTU为单元的矩阵文件。
DADA2去噪分析分辨率更高,准确性更强。
双端数据命令示例:
1.降噪
输入:导入QIIME 2的 raw reads(summary_pe.qza)
time qiime dada2 denoise-paired \
--i-demultiplexed-seqs summary_pe.qza \
--o-table table-dada2_pe.qza \
--o-representative-sequences rep-seqs-dada2_pe.qza \
--o-denoising-stats dada2-stats_pe.qza \
--p-trim-left-f 0 \
--p-trim-left-r 4 \
--p-trunc-len-f 220 \
--p-trunc-len-r 240
参数解释:
–p-trim-left-f 0 :表示从forward左端的第0位置开始裁剪
–p-trim-left-r 0: 表示从reverse左端的第0位置开始裁剪
–p-trunc-len-f 250 :表示forward总共保留的长度为250
–p-trunc-len-r 250:表示reverse总共保留的长度为250
输出:
table-dada2_pe.qza:特征表:即后缀名为biom的OTU table文件。
rep-seqs-dada2_pe.qza: 代表序列文件
dada2-stats_pe.qza: 过程统计文件
上面的参数(非0数字(—p-n-threads除外))因个人的测序而定
2.过程统计文件可视化:
qiime metadata tabulate \
--m-input-file dada2-stats.qza \
--o-visualization dada2-stats.qzv
dada2-stats.png
3. 导出otu table文件并转化格式
QIIME 2 的产物 qza 后缀文件相当于一个压缩包,可以使用 “ unzip ”命令解压。
特征表文件 feature_table.qza 或 table.qza 文件解压后,在 data/ 目录下会获得一个后缀为.biom的文件,将其转换为 tsv 文件的命令是:
unzip table-dada2.qza
biom convert -i feature-table.biom -o table.tsv --to-tsv
4. otu table和代表序列可视化
qiime feature-table summarize \
--i-table table-dada2.qza \
--o-visualization table.qzv \
--m-sample-metadata-file sample-metadata.tsv
qiime feature-table tabulate-seqs \
--i-data rep-seqs.qza \
--o-visualization rep-seqs-dada2.qza
单端数据命令示例:
qiime dada2 denoise-single \
--i-demultiplexed-seqs demux-summary.qza \
--p-trim-left 0 \
--p-trunc-len 120 \
--o-representative-sequences rep-seqs-dada2.qza \
--o-table table.qza \
--o-denoising-stats dada2-stats.qza