关注|多组学研究者看过来!!!
╱ preface ╱
多组学(Multi-Omics)即为利用多个组学数据整合,从基因组、转录组、蛋白质组、表观基因组、代谢组和微生物组等不同分子层面大规模获取组学数据,进行整合分析。多组学整合数据分析使得生物学发生了革命性的变化,促进对生物过程和分子机制的深刻理解,为基础生物学以及临床研究提供新思路。
了解多组学分析内容及应用,是挖掘多组学数据间联系的必经之路。多组学分析结果表现形式多种多样,本期小易重点介绍几种文章中常见的相关性分析,赶紧来围观,总有一种展示方式能成为您的心头爱!
01 相关性热图
相关性热图是一种能直观展现多组学间相关性趋势变化的首选,展示对象多变,任君选择——微生态研究中的差异代谢物与差异微生物种类分布,转录组研究中基因表达与代谢产物的相关性,或者表型参数与对应测序数据的联系等等,相关示例图如下:
说明:中间的热图展示的是差异微生物与差异代谢物的spearman相关性。横坐标表示代谢物,纵坐标表示微生物,其中p-value<0.05为差异显著,用“*”表示,p-value<0.01为差异极显著,用“**”表示。右边热图展示的是不同分类水平上微生物的丰度,下边的热图展示的是代谢物的丰度。微生物和代谢物的丰度数据均使用Z-score标准化
说明:行表示微生物,列表示代谢物。左侧进化树表示微生物层次聚类结果,上方的进化树表示代谢物的层次聚类结果。红色表示正相关,蓝色表示负相关。相关系数的显著性检验的p-value<0.05为差异显著,用“*”表示,p-value<0.01为差异极显著,用“**”表示
说明:行为代谢物,列为微生物。红色椭圆表示负相关,蓝色椭圆表示正相关。相关性绝对值越大,椭圆越细。空白格子表示显著性P值大于0.05
02 相关性散点图
相关性散点图是相关性分析中常用的一种直观分析方法,计算两组数据的相关性,用散点图和拟合曲线可以完美展示数据内在的分布。如果两者之间完全相关,数据点全落在拟合直线上;如果部分相关,数据点则落在直线的两侧;如果不相关,则两个变量的数据点分布分散,无任何规律。
说明:横纵坐标为两计算变量,点代表样本,不同分组可以用不同颜色代表,左上角的r为相关系数,P值为该相关性的显著性水平
03 相关性和弦图
和弦图是另外一种展示数据间相互关系的可视化方法,节点数据沿圆周径向排列,节点之间使用带权重(有宽度)的弧线连接,弧线越宽,相关性越高,同时不同的颜色可以表示正负相关性。
说明:弦连接(link)的宽度表示所连接的两个对象的相关性大小,link越宽,相关性绝对值越大。粉红色表示正相关性,蓝色表示负相关性
04 相关性网络图
相关性网络图通过相关性分析计算变量之间的相关系数,以⽹络图来展⽰数据的内部结构,并利用点及连线颜色、大小、粗细等元素展示显著相关的特征节点间的相互作⽤关系,以寻找变量之间的关系。变量可为单一数据矩阵,也可为两个数据矩阵,既适用于单一组学分析,如代谢组、蛋白组、转录组、微生物组等,也适用于两两组学间分析,如代谢组+蛋白组、代谢组+转录组等。
说明:目标微生物与差异代谢产物之间的相关性网络,不同的颜色代表不同的聚类模块