当宏基因组遇见宏蛋白组
好了,让我们持续关注肠道微生物菌群(gut microbiota ,GM)。
众所周知,目前研究宏基因组最常用方法的是扩增子、和全基因组测序。虽然方法简单高效,但缺点也是显示易见的。比如只针对DNA为研究对象,这样无法判断研究对像是否还活着,连上百万年的化石都会有DNA保存下来可以测序。
要想逼近真想我们还有很长的路下走,在模式生物研究中,转录组和蛋白组有较多的数据积累,有Sciences文章大规模分析表明:蛋白水平与转录水平的相关性很低,远超大家的想象。那么基因组水平与蛋白水平的相关性又是如何呢?
本期要和大家分享的是一篇来自Porto Conte Ricerche Science and Technology Park of Sardinia(撒丁岛孔蒂里切科技园)的文章,文章比较了健康人的肠道微生物群潜在功能(宏基因组)和有效功能(宏蛋白组)之间的一致性。为了回答常规的宏基因组测序预测得到的功能蛋白与真实的蛋白之间到底有多少是一致的,作者设计了以下实验:
由于本文是固定实验材料比较不同方法的结果变量关系,因此在保证样本具有代表性的同时,要保证样本的稳定性因此在健康人群中剔除了以下条件:
(i)样本采集前6个月的抗菌治疗,
(ii)炎症性肠病和其他自身免疫疾病,
(iii)过去2周内体温的显着变化,
(iv)样本采集前最后3年内体重波动异常
- Illumina shotgun DNA sequencing (metagenome profiling)
- LTQ-Orbitrap shotgun mass spectrometry analysis (metaproteome profiling)
肠道菌群的潜在和有效功能(R模型)
PCA分析。MG为蓝色,而MP为红色。 每个点(具有不同的形状)代表不同的个体。 (A)门; (B)属; (C)KOG; (D)KOG-phylum组合
取top5的门、top10 的属以及top10的KOG丰度做箱型图:
肠道微生物群的主要宏基因组(MG)和宏蛋白组(MP)特征。 MG数据为蓝色(左),MP数据为红色(右)。 通过降低受试者之间相对丰度的中值来排序数据。
a, Tukey的箱形图显示了前5个微生物门。
b. Tukey的箱形图显示了前十大微生物属。
c. Tukey的箱形图显示了前10个基因/蛋白质功能(KEGG直系组)。
宏基因组和宏蛋白组的数据关于物种分类水平上比较一致,但是在功能方面MG与MP差异较大。
计算每个受试者两组(MG对MP)之间每个特征丰度的差异程度,表示为相对丰度对数比。 使用单样本t检验和Benjamini-Hochberg校正进行多次测试,进一步测试了对数比率的显着偏差。 nd, not differential.
dataset | > in MP | nd | > in MG | |
---|---|---|---|---|
taxa | MG dataset | 6% | 35% | 59% |
MP dataset | 9% | 55% | 36% | |
KOG | MG dataset | 6% | 5% | 89% |
MP dataset | 26% | 28% | 46% |
差异特征(MG对MP)在总数中的百分比极高,证实了潜在和有效的GM功能特征之间的差异。
a. 基于样品群组中每个特征的平均相对丰度(阈值> 0.01%)过滤数据。 分类图显示差异丰富的分类群(MG中蓝色更丰富,MP中红色更丰富)。 点大小与相应分类单元的平均相对丰度成比例。可以看出只有少量差异物种在较近的分支上,大部分差异物种在MG和MP中区分明显。
b条形图显示具有较高MP / MG对数比的KEGG直系功能(top 20,左侧)和具有较低MP / MG对数比(top20,右侧)的那些,次级单元名称显示在括号中。MP / MG对数比较高的蛋白中SCFA、碳水化合物降解相关、有机酸、铁蛋白等;较低的蛋白有tRNA,细胞壁合成相关,DNA复制与修复等。可见MG与MP在物种与功能注释中差异较大。
代谢功能具有在KEGG碳代谢途径中定位的MP和MG数据集之间的差异丰度。 红色箭头表示MP数据集中具有显着更高丰度的酶,而蓝色箭头表示MG数据集中具有显着更高丰度的酶。
肠道微生物群中的保守和可变特征(Q模式)
计算样本间属水平和功能水平的BC距离。与MP相比,可以在MG中测量关于分类组成的更高的个体间变异性(具有连续性校正的Wilcoxon秩检验,two-tailed P = 4.7×10-8),同时功能数据的分析显示MP的变异性高于MG(P <2.2×10-16)。
为了进一步评估哪个特定的GM分类群和功能在研究中的人群中更加保守和可变,我们计算了每个分类群的丰度变异系数(CV)。
cv<60% | 60%<cv<150% | cv>150% | ||
---|---|---|---|---|
taxa | MG dataset | 10% | 56% | 34% |
MP dataset | 12% | 57% | 31% | |
KOG | MG dataset | 59% | 39% | 2% |
MP dataset | 19% | 49% | 32% |
肠道微生物群特征的个体间差异。 基于样品群组中特征的平均相对丰度(阈值> 0.01%)过滤数据。
根据MG(蓝色)和MP(红色)数据,分类图显示了受试者的CV> 150%(可变,较深的颜色)或<60%(保守,较浅的颜色)的分类群。 绿点代表基于MG和MP数据发现的保守(暗)或可变(轻)的分类群。 点大小与相应分类单元的平均相对丰度成比例。虽然分类群没有表现出相反的趋势(例如,MG的低变异性和MP的高变异性),MG和MP之间可以观察到关于分类群丰度变异性的相关性不强(ρ= 0.33)。
b 根据MG(左,蓝色)和MP(右,红)数据显示10个KEGG直系功能组的条形图,其具有较高的CV(可变,较暗的颜色)和10个具有较低的CV(保守的,较浅的颜色)的受试者。 MG与MP之间关于功能丰度变异性的相关性非常弱(ρ= 0.12)。
厚壁菌门(Firmicutes)和拟杆菌门(Bacteroidetes)的对特定功能贡献。
在整体上比较了宏基因和宏蛋白组在物种分类和功能上的差异后,作者还寻求发现某些门对功能的贡献,即主要或仅由主要GM门(Firmicutes或Bacteroidetes)而产生的功能。
KEGG直系功能组在厚壁菌门和拟杆菌之间具有显着差异的丰度。 基于样品群组中特征的平均相对丰度(阈值> 0.01%)过滤数据。 左侧条形图(蓝色),根据MG数据具有更高(前10个)和更低(前10个)F/ B对数比; 右侧条形图(红色),根据MP数据具有更高(前10)和更低(前10)F/ B对数比。拟杆菌特异性参与多种活动,包括铁稳态,非葡萄糖单糖(鼠李糖,木糖)和叶酸代谢的分解代谢,而厚壁菌门对GM代谢的特异性贡献主要在于丁酸生物合成,是大部分差异酶。
主要肠道微生物群成员在碳水化合物代谢中的积极作用
为了进一步阐明主要基因在碳水化合物代谢中的特定作用,作者解析了由MP鉴定的负责多糖降解到SCFA生产的转运蛋白和酶的功能与分类学注释。
活跃的碳水化合物代谢途径和相关的分类学注释结果。
a 从碳水化合物摄取和降解到短链脂肪酸生成的肠道微生物群代谢途径的示意图(粗体)。粗体数字对应于b中列出的代谢途径。
b通过MP分析发现的碳水化合物代谢途径/酶(行)和特定肠道微生物门/属(列)的组合。热图颜色标度基于每个功能 - 分类组合的对数相对丰度(15个受试者的平均值)。对于每个途径(行),仅报告在至少一半受试者中检测到的酶,而顶行(粗体,对应于黑色边界正方形)占所有酶的总丰度(在至少一个受试者中发现) )属于该途径。对于每个门(列),仅报告在至少两个受试者中表达功能的属,并且门(粗体,对应于黑色边界的正方形)解释分配给给定门的所有功能的总丰度。碳水化合物代谢似乎是由于厚壁菌和拟杆菌(分别占总数的46%和51%)起作用,放线菌在数量上起着次要作用(3%)。
结果
宏基因组和宏蛋白组的数据关于物种分类水平上比较一致。另一方面,个体的遗传背景和功能活性差别还是很明显的,波动范围大于宏基因组的结果,表现为更高的可塑性。对分类学某类特异菌贡献功能活性或代谢物的分析,发现某些类菌特异的碳水化合物代谢活性,如多糖降解、多糖转运、糖酵解、短链脂肪酸生成等。厚壁菌门中主要是Faecalibacterium促进丁酸盐合成有着最高的表达率及代谢活性,个体间差异最小。此类物质在以前研究中报导为重要的微生物产物并维持肠道的动态平衡。
结论
本研究发现健康人群中GM功能潜在与表达之间存在相当大的差异。 此外,我们的结果提供了对“正常”GM的主动功能和代谢任务的理解的见解,突出了丁酸盐生产的总体关键重要性。 还提供了关于基因分类群对主要功能活动的具体贡献的详细图谱,重点是碳水化合物代谢。 我们的数据表明,在根据宏基因组数据得出关于实际基因功能活动的结论之前应该谨慎使用,本研究提倡将MP作为调查基因在健康和疾病中的功能作用的方法。
参考:
Microbiome:宏蛋白质组揭示健康人肠道菌群的功能,离真相更近了一步
Potential and active functions in the gut microbiota of a healthy human cohort