生物信息学生物信息学与算法

Qiime1-7.去除嵌合体

2018-10-29  本文已影响2人  jlyq617

嵌合体(Chimeras)是PCR阶段不正常的扩增过程所产生的序列。
嵌合体由两条及以上的模板链组成,是PCR延伸阶段的不完全延伸造成的。

Chimeras

通常有1%的几率会出现嵌合体序列,而在16S/18S/ITS扩增子测序的分析中,由于序列间相似度较高,所以概率会更高。

在去除嵌合体的同时我们会造成一定的数据损失,是否需要去除嵌合体是一个有争议的问题,如果你不想去除嵌合体可以选择跳过这一步直接进行后续的分析。

去除嵌合体主要分为四步:
1、鉴定嵌合体
2、去除嵌合体
3、生成不含嵌合体的Phylogenetic Tree
4、生成不含嵌合体的OTU Table

Step1: 鉴定嵌合体

parallel_identify_chimeric_seqs.py \
-i pick_otus/pynast_aligned_seqs/rep_set_aligned.fasta \
-o pick_otus/chimeric_seqs.txt \
-m ChimeraSlayer \

Step2: 去除嵌合体

filter_fasta.py \
-f pick_otus/pynast_aligned_seqs/rep_set_aligned.fasta \
-o pick_otus/pynast_aligned_seqs/rep_set_aligned_chimerafree.fasta \
-s pick_otus/chimeric_seqs.txt \
--negate
#进行基本的过滤去除高变区
filter_alignment.py \
-i pick_otus/pynast_aligned_seqs/rep_set_aligned_chimerafree.fasta \
-o pick_otus/

Step3: 生成不含嵌合体的Phylogenetic Tree

make_phylogeny.py \
-i pick_otus/rep_set_aligned_chimerafree_pfiltered.fasta \
-o pick_otus/rep_set_chimerafree.tre

Step4: 生成不含嵌合体的OTU Table

make_otu_table.py \
-i pick_otus/final_otu_map_mc2.txt \
-o pick_otus/otu_table_rdp_nochimera.biom \
-t pick_otus/rdp_assigned_taxonomy/rep_set_tax_assignments.txt \
-e pick_otus/chimeric_seqs.txt

最终生成的文件:

  1. OTU Table (pick_otus/chimeraslayer/otu_table_rdp_nochimera.biom)
  2. Phylogenetic Tree (pick_otus/chimeraslayer/rep_set_chimerafree.tre)
  3. Representative Sequences (pick_otus/chimeraslayer/rep_set_aligned_chimerafree.fasta)
上一篇下一篇

猜你喜欢

热点阅读