statquest学习笔记——correlation
2020-04-06 本文已影响0人
Maven
1. 什么是相关性
correlation指两组数据之间的相关性
假设现有5个细胞,统计每个细胞中表达的gene X 与gene Y的表达情况,并绘制点图,我们可以很直观的看出图1中的gene X 与gene Y有很强得相关性,图2有弱的相关性
图1 图2
2. 如何计算两组数据之间的相关性
image.png两组数据之间的相关性的范围为[-1,1], 相关性为正值时,两组数据之间呈正相关,为负值时,为负相关。相关性越接近于1两者相关性越强;没有关系时,相关性为零。
两组数据的相关性与两组数据的大小无关
数据越多,两组数据之间相关性的可信度越高,P-value越小
image.png