NBT | 基于培养的1520人肠道细菌参考基因组
文献信息:
文献:1,520 reference genomes from cultivated human gut bacteria enable functional microbiome analyses
中文:来自人肠道细菌的1520参考基因组促进功能宏基因组分析
单位:BGI
杂志:nature biotechnology
时间:2019
摘要:
参考基因组对于宏基因组分析和人类肠道菌群的功能特性是必不可少的。我们提供了可培养基因组参考(CGR),这是一组1520个非冗余、高质量的草图基因组,这些基因组来自于从健康人类粪便样本中培养的>6000个细菌。这1520个基因组涵盖了人类肠道中所有主要的细菌门和属,其中有264个基因组没有出现在现有的参考基因组目录中。我们的研究表明,参考细菌基因组数量的增加提高了映射元基因组测序读码率,从50%提高到70%,使人类肠道微生物组的描述更具分辨率。我们使用CGR基因组注释了338种细菌的功能,显示了这一资源在功能研究中的效用。我们还对38种重要的人类肠道物种进行了泛基因组分析,揭示了它们核心基因组和可有可无基因组之间功能富集的多样性和特异性。
CNGB数据链接:
https://db.cngb.org/search/project/CNP0000126/
NCBI数据链接:
https://www.ncbi.nlm.nih.gov/bioproject/PRJNA482748/
1 1520种分离肠道细菌全基因组序列的系统发育树
在CGR中,根据1520个高质量基因组的全基因组序列,将其划分为338个种级集群(ANI≥95%)。最外层的条表示每个集群中存档的基因组数量。
2 CGR提高mapping率
当前数据集CGR和先前数据IGCR mapping率的比较。two-side Wilcoxon rank-sum test做显著性检验。
3 SNP分析
参考:Shotgun Metagenomics of 250 Adult Twins Reveals Genetic and Environmental Impacts on the Gut Microbiome
看点:细菌snp calling;细菌snp宿主表型关联分析。
在之前的研究[参考] (IGCR,绿色)和当前的研究(CGR,蓝色)中生成的用于SNP分析的参考基因组。在CGR中,未分类的参考基因组的种类用紫色标出。
4 功能分析
KEGG通路
VFDB毒力因子
CARD抗性基因
在CGR的1520个基因组中,所列功能的基因丰度通过热图的颜色深度显示出来。所列功能在特定的门或属(a)中丰富,或可能对人类健康有有害或有益的影响(b)。细菌种类按图1中的系统发育树排列。系统发育树中门属的相对位置分别用彩带和圆点表示。
5 非代表性肠道微生物核心和泛基因组分析
定义:
Core and pan-genomes of underrepresented gut bacteria
The pan-genome of a cluster can be defined as the sum of the core genes and dispensable genes (including unique genes and accessory genes) of all the members within that cluster
非代表性肠道微生物:文中有36种,每种超过10个不同的基因组
pan-genome:多个基因组cluster产生,是核心基因和非必须基因的集合
ARGs(antibiotic resistance genes)在核心基因组(粉红色)和可有可无基因组(青色)中的分布。