宏基因组--微生物多样性
操作分类单元(Operational Taxonomic Units,OTU)是在系统发生学研究或群体遗传学研究中,为便于分析,人为给某一个分类单元(品系,种,属,分组等)设置的同一标志。一般情况下,如果序列(tags)之间的相似性高于97% 就可以把它定义为一个 OTU。每个OTU对应于一种代表序列。
alpha多样性分析
alpha多样性一般指样本内物种的多样性程度,即不侧重于比较,而只是评估样本内的多样性程度
多样性指数统计(软件:mothur)
计算菌群丰富度(Community richness)的指数:
(1)Observed_species:直接观测到的OTU的个数。
(2)Chao:用于估计样本中物种总数,数值越大代表物种越多。
(3)ACE:用于估计样本中物种总数,数值越大代表物种越多,与Chao1的算法不同。
计算菌群多样性(Community diversity)的指数:
(1)Shannon:用来估算样本中微生物的多样性指数之一。Shannon值越大,说明群落多样性越高。
(2)Simpson:用来估算样本中微生物的多样性指数之一, Simpson指数值越大,说明群落多样性越低。
(3)InvSimpson:1-Simpson指数值,InvSimpson指数值越大,说明群落多样性越高。
(4)Coverage:指各样本文库的覆盖率,其数值越高,则样本中序列被测出的概率越高,而没有被测出的概率越低
结果举例:
beta多样性分析
其他统计分析
1.组间差异显著性分析:主要用于发现不同组间具有统计学差异的 Biomarker。更具设定的biomarker筛选标准(LDA score>4)找出符合条件的biomarker,以图标方式展现;常见分析方法有Lefse分析筛选biomarker;Metastats分析通过p、q值比较各分类水平下两两分组间的差异显著性
软件:LEfSe(Line Discriminant Analysis (LDA) Effect Size)、Metastats
2.多元统计分析:ANOVA(方差分析)、Wilcox秩和检验、三元相图
3.16S功能基因预测分析:KEGG功能预测、COG功能预测
4.相关性分析
5.进化树分析
6.环境因子分析
7.相似性分析(ANOSIM)
补充相关软件链接:
Trimomatic: http://www.usadellab.org/cms/index.php?page=trimmomatic
Flash: http://ccb.jhu.edu/software/FLASH/
FASTQC: http://www.bioinformatics.babraham.ac.uk/projects/fastqc/
uparse: http://www.drive5.com/usearch/manual/uparseotu_algo.html
RDP 数据库: http://rdp.cme.msu.edu/
mothur: www.mothur.org
R: http://www.r-project.org/
metastats: http://metastats.cbcb.umd.edu/detection.html
Fasttree: http://www.microbesonline.org/fasttree/
megan: http://ab.inf.uni-tuebingen.de/software/megan/
cytoscape: http://www.cytoscape.org/