生信funny生物信息

表达量计算--RPKM, FPKM, TPM

2020-02-01  本文已影响0人  曲凉不见

转自:https://www.cnblogs.com/jinhh/p/8964790.html

基因表达量的衡量指标有:RPKM、FPKM、TPM。

RPKM:Reads Per Kilobase Million=Reads Per Kilobase Per Million Reads,即每一百万条Reads中,对基因的每1000个Base而言,比对到该1000个base的Reads数。
\frac{R1*10{}^{9}}{L1*RT}

R1=map到该基因的reads总数
L1=该基因长度
RT=map到基因组的总reads数

FPKM:Fragments Per Kilobase Million=Fragments Per Kilobase Per Million Reads。
\frac{F1*10{}^{9}}{L1*FT}

F1=map到该基因的fragments总数
L1=该基因长度
FT=map到基因组的总fragments数

FPKM意义与RPKM的区别仅在于,Fragment 与 Read。
RPKM的诞生是针对早期的SE测序,FPKM则是在PE测序上对RPKM的校正。
Reads即是指下机后fastq数据中的每一条Reads,Fragments则是指每一段用于测序的核酸片段,在SE中,一个Fragments只测一条Reads,所以,Reads数与Fragments数目相等;在PE中,一个Fragments测两端,会得到2条Reads,但由于后期质量或比对的过滤,有可能一个Fragments的2条Reads最后只有一条进入最后的表达量分析。总之,对某一对Reads而言,这2条Reads只能算一个Fragments,所以,Fragment的最终数目是Reads的1到2倍之间。

TPM:​Transcripts Per Million。
TPM的计算分3步:
step1:根据基因/转录本长度​校正count值;假设某基因count值为R1,则校正后count值为:
R1/(L1/1000)​ ==> L1为该基因的长度;
step2:计算total 校正后count值;即所有基因的校正后count值​总和,Rtotal;
step3:计算TPM;TPM​结果为:
\frac{R1*10{}^{9}}{L1*Rtotal}

上一篇下一篇

猜你喜欢

热点阅读