微生物16S/宏基因组/代谢组

文献(动脉粥样硬化代谢与微生物关系)

2019-07-19  本文已影响0人  苏可_7fe6

Alterations in the gut microbiome and metabolism with coronary artery disease severity

一.过程

文章过程.PNG

①将161例冠心病患者随机分为稳定型冠心病(SCAD)组、不稳定型心绞痛(UA)组、心肌梗死组(MI)40例。
②我们构建了一个由274个OTU组成的共丰度网络,并将它们聚为24个共丰度组(CAGS),并识别出不同cad组之间显著不同的重要的CAGS。
③进行了一个“交叉比较方案”,以确定在不同的群体血清代谢物的特点。将血清代谢产物归纳为共丰度代谢模块,筛选出与cad表型显著正相关或负关联的干扰特征。
④鉴定肠道微生物组成、宿主代谢谱和主要cad表型之间的相关性分析。
⑤利用验证队列中最重要的CAGS和Metabotypes,对交叉验证的随机森林分类器的ROC进行了分析,对各个组之间(Con VS CAD, Con VS SCAD, SCAD VS UA, SCAD VS ACS, UA VS MI)进行分类辨别。

二.结论

① 通过对160名冠心病患者和40名健康人进行多组学分析,发现肠道菌群和血清代谢物随着冠心病(CAD)严重程度发生变化;
② 确定了与CAD严重程度相关的29个血清代谢物模块;
③ 分析并鉴定了与CAD严重程度相关的肠菌CAG;
④ 特定菌群可能通过影响宿主的代谢途径,影响患者动脉粥样硬化严重程度;
⑤ 基于上述微生物和代谢物所构建的疾病分类器,不仅可以在另一验证队列中准确区分疾病与健康人群,甚至可以用于鉴别不同的冠心病亚组。

三.方法

1.全代谢组分析

代谢1.PNG

(1)使用SIMCA-P
(2)多元统计分析方法,并用交叉验证模型的有效性
1)PCA分析
无监督算法,只有一个数据集,分类对数据没影响,不利于发现组间差异
2)PLS-DA分析
有监督算法,人为加一个数据集,减小组内差异,类似于PCA
3)OPLS-DA分析
将PLS中y数据集减少为只有一个变量,而这个变量在比较的两组中的值被设定为一个极大一个极小。因此将原始数据矩阵X中系统差异分为两个部分,一部分变量与回归矩阵Y线性相关,另外一部分变量与回归矩阵线性无关。
具体为有两种主成分,即预测主成分(只有一个)和正交主成分(可以多个),将组间差异最大化反应在t1上,而正交组成分反应组内差异。
(3)代谢组学单变量差异分析
1)T检验:适用于两组样本方差齐性,常用火山图
2)ANOVA:适用于三组以上样本各组样本方差齐性,常用趋势图
(4)VIP:判断单个自变量在解释因变量时的重要性,衡量代谢物的表达模式对各组样本分类判别的影响,辅助标志代谢物的筛选。
(5)通路富集分析
运用HMBD、KEGG、LMSD等进行ORA\FCS分析
(6)代谢通路可视化
(6)化合物ID转化

2.高含量血清代谢产物的聚类研究

3.粪便样品中提取DNA和16S rRNA基因v3-v4区域测序细菌DNA

制备了16S rRNA基因v3-v4区的测序文库。用Illumina miseq系统将纯化的产物按同等比例混合测序。

4.测序数据分析

(1)USEARCH v.8.0
(2)RDP classifier
系统差异分析,匹配测序深度的差异。
(3)Qiime v1.8.0:
α-和β-多样性分析。对香农指数、the observed OTUs, and Chao1 index 进行评价。利用归一化的TOU丰度表进行β-多样性分析,包括基于Bray-Curtis的主坐标分析、加权的unifrac和未加权的unifrac距离。
(4)PERMANOVA
检验统计学效应
(5)Adonis检验
计算我们收集到的每一个宿主因子所解释的变异。
5.SparCC产生微生物群
找到CAGs,并利用WGCNA进行Ward clustering algorithm。
6.Spearman多关联分析
用r计算CAGS、血清代谢物模块和临床参数之间的Spearman相关关系,用Wilcoxon秩和检验CAGS和cad相关代谢型的差异丰度。Benjamini-Hochberg控制FDR。
7.随机森林模型进行特征选择
利用CAGS模型和代谢物模型,将发现阶段样本随机分为训练集和测试集。对70%的样本进行随机森林分类器训练,并在R.中使用随机森林包对其余30%的样本进行测试,然后在该模型的基础上使用另一个独立的队列进行进一步的预测。我们在训练集中使用了十倍交叉验证。在最小交叉验证误差下,我们建立了一组最优变量集,最重要的变量建立了预测模型。当将较小的模型应用于测试集时,将其作为AUC进行性能测试,并利用pROC r软件包计算了ROC曲线的置信区间。

参考
(1)https://www.jianshu.com/p/e291250595b9
(2)http://www.sohu.com/a/323169773_785442
(3)https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6486680/#CR72

上一篇下一篇

猜你喜欢

热点阅读