转录组数据分析

RPKM, FPKM以及TPM

2020-09-23  本文已影响0人  斩毛毛

简单概念

其中当为single-end 测序,RPKM 与 FPKM 是等价的

计算方法

其中心思想即是由于基因长度,以及测序深度的不同,导致每个基因在每个样本中得到的reads count必须经过一定的标准化;因为深度约深,基因长度越长, 所得到的reads count越多,这在统计学上是不合理的,因此需要标准化。

上述存在两个变量,即基因长度, 测序深度,因此,将获得的reads count 依次除以 测序深度,基因长度,即同时比较在每1Kb 每百万reads情况下的reads count。

RPKM/FPKM 首先除以测序深度,而后在除以基因长度。
** 注意均以1kb,即百万为一个单位。

相对于上述两种情况,TPM 计算的顺序不同。

先以基因长度进行标准化,即mapped reads count / length(kb)

而后以得到的结果计算all reads/1000000(百万为一单位), 然后在除以all reads即可得到TPM值。

实则TPM即是 RPKM的百分比;
比如:有3个基因(A,B,C) RPKM分别为 12,32,41
则 A基因的TPM为 12*1000000/(12+32+41), 因此每一个样本的TPM 值之和均等于1000000。

通过RPKM 也可计算TPM,具体可查看What the FPKM? A review of RNA-Seq expression units

参考

上一篇下一篇

猜你喜欢

热点阅读