StatQuest学习笔记分享

34统计基础- 分位数标准化(Quantile Normaliz

2021-01-08  本文已影响0人  不到7不改名

假设我们有一些来自微阵列实验的数据

如果你不熟悉微阵列,这里有解释:

  1. 微阵列测量样本中基因的活性。

  2. 他们通过测量不同颜色的光的强度来做到这一点。

  3. 如果你在一个实验中有一个更好的灯泡,那么每个测量结果都可能比另一个实验的结果更大。

因此,我们需要标准化数据来解释实验之间的技术差异,这与生物学无关。

这是我们的数据。在这张图中,每种颜色代表一个不同的基因。这些颜色与实际微阵列实验中扫描到的颜色不同。此时,那些颜色已经转换为强度值。每个样本都有不同的平均值,这表明我们需要对不同的整体光强进行补偿。分位数标准化(Quantile Normalization)纠正了这个技术。

  1. 先关注每个样本中表达最高的基因

  2. 然后计算三个样本中表达最高基因的平均值

  3. 表达量最高的基因的分位数归一化值为其平均值

  4. 现在把注意力集中在每个样本中第二个高表达基因上,重复步骤1-3,知道标准化所有基因。

image-20201228165900664.png

分位数标准化(Quantile Normalization)后,每个样本的值都相同,但是原始的基因顺序被保留了下来。他们称之为“Quantile Normalization”,因为标准化的数据集有分位数相同。

上一篇下一篇

猜你喜欢

热点阅读