Qiime2 (三)-DADA2降噪（Denoise）流程

2020-08-20 本文已影响0人佳名

Dada 2 流程

DADA2数据处理不以序列相似度聚类，只进行去重（或相当于以100%序列相似度聚类），生成的是以ASV为单元的表格；
Vsearch数据处理与Usearch类似，以序列间相似度聚类（默认序列相似度为97%），生成的是OTU为单元的矩阵文件。
DADA2去噪分析分辨率更高，准确性更强。

双端数据命令示例：

1.降噪

输入：导入QIIME 2的 raw reads（summary_pe.qza）

time qiime dada2 denoise-paired \
--i-demultiplexed-seqs summary_pe.qza \
--o-table table-dada2_pe.qza \
--o-representative-sequences rep-seqs-dada2_pe.qza \
--o-denoising-stats dada2-stats_pe.qza \
--p-trim-left-f 0 \
--p-trim-left-r 4 \
--p-trunc-len-f 220 \
--p-trunc-len-r 240

参数解释：

–p-trim-left-f 0 ：表示从forward左端的第0位置开始裁剪
–p-trim-left-r 0：表示从reverse左端的第0位置开始裁剪
–p-trunc-len-f 250 ：表示forward总共保留的长度为250
–p-trunc-len-r 250：表示reverse总共保留的长度为250

输出：

table-dada2_pe.qza:特征表：即后缀名为biom的OTU table文件。
rep-seqs-dada2_pe.qza: 代表序列文件
dada2-stats_pe.qza: 过程统计文件

上面的参数（非0数字（—p-n-threads除外））因个人的测序而定

2.过程统计文件可视化：

qiime metadata tabulate \
--m-input-file dada2-stats.qza \
--o-visualization dada2-stats.qzv

dada2-stats.png

3. 导出otu table文件并转化格式

QIIME 2 的产物 qza 后缀文件相当于一个压缩包，可以使用 “ unzip ”命令解压。
特征表文件 feature_table.qza 或 table.qza 文件解压后，在 data/ 目录下会获得一个后缀为.biom的文件，将其转换为 tsv 文件的命令是：

unzip table-dada2.qza
biom convert -i feature-table.biom -o table.tsv --to-tsv

4. otu table和代表序列可视化

qiime feature-table summarize \
  --i-table table-dada2.qza \
  --o-visualization table.qzv \
  --m-sample-metadata-file sample-metadata.tsv
qiime feature-table tabulate-seqs \
  --i-data rep-seqs.qza \
  --o-visualization rep-seqs-dada2.qza

单端数据命令示例：

qiime dada2 denoise-single \
--i-demultiplexed-seqs demux-summary.qza \
--p-trim-left 0 \
--p-trunc-len 120 \
--o-representative-sequences rep-seqs-dada2.qza \
--o-table table.qza \
--o-denoising-stats dada2-stats.qza