33统计基础- 分位数-分位数图
2021-01-07 本文已影响0人
不到7不改名
我们共检测了15个基因的表达。这个数据是正态分布的吗?Q-Q图有助于回答这个问题。
-
给每个点一个分位数
-
得到一条正常的曲线(任何正常的曲线都可以)
-
向曲线中添加与创建数据相同数量的分位数
有15行将数据分成大小相等的组,有15条线将正常曲线分成大小相等的组。对于正常曲线,“相同大小的组”意味着在每个组中观察一个值的概率相等。这意味着边缘上的组必须更宽,以解释观察到某个值的可能性更低。而中间的组更窄,因为在那个区域观察到一个值的概率更高。
4.画出你的Q-Q图
image-20201228162945180.png现在看看这些点与直线的匹配情况,如果数据是正态分布的,大部分点会在直线上。在个例子中,点与线拟合不好。所以我们应该将收集到的数据与其他分布进行比较。
如果我们将我们的数据与均匀分布相比较会怎样?Q-Q图上的点更接近直线,说明均匀分布的拟合效果更好。
image-20201228163342161.png最后一件事!如果我们想要将原始数据集与另一个数据集进行比较(第二个数据集要小得多),该怎么办?新数据集只有4个分位数。因此,我们为原始数据集确定4个分位数。在我们的图中只有几个分位数,很难确定两个数据集是否有相似的分布。但是你明白的,如果我们收集更多的数据,我们就会有更多的分位数,就会知道更多。
image-20201228163655691.png