RPKM, FPKM以及TPM
2020-09-23 本文已影响0人
斩毛毛
简单概念
- RPKM (Reads Per Kilobase Million 每千碱基百万个读数)
- FPKM (Fragments Per Kilobase Million 每千碱基百万个碎片)
- TPM (Transcripts Per Kilobase Million每千碱基记录本)
其中当为single-end 测序,RPKM 与 FPKM 是等价的
计算方法
- RPKM/FPKM
其中心思想即是由于基因长度,以及测序深度的不同,导致每个基因在每个样本中得到的reads count必须经过一定的标准化;因为深度约深,基因长度越长, 所得到的reads count越多,这在统计学上是不合理的,因此需要标准化。
上述存在两个变量,即基因长度, 测序深度,因此,将获得的reads count 依次除以 测序深度,基因长度,即同时比较在每1Kb 每百万reads情况下的reads count。
RPKM/FPKM 首先除以测序深度,而后在除以基因长度。
** 注意均以1kb,即百万为一个单位。
- TPM
相对于上述两种情况,TPM 计算的顺序不同。
先以基因长度进行标准化,即mapped reads count / length(kb)
而后以得到的结果计算all reads/1000000(百万为一单位), 然后在除以all reads即可得到TPM值。
实则TPM即是 RPKM的百分比;
比如:有3个基因(A,B,C) RPKM分别为 12,32,41
则 A基因的TPM为 12*1000000/(12+32+41), 因此每一个样本的TPM 值之和均等于1000000。
通过RPKM 也可计算TPM,具体可查看What the FPKM? A review of RNA-Seq expression units