【R语言】超几何分布-富集分析-富集度计算
2020-03-12 本文已影响0人
怪毛匠子君
- 使用R语言的包计算超几何分布下的富集程度及Pvalue
参照其他博主的 内容,超几何分布是一种非常常见的分布,常用来表示在N个物品中有指定商品M个,不放回抽取n个,抽中指定商品的个数,即X~H(N,n,M),则抽中k件M商品的概率为:
超几何分布N为(1)全部样本的数量,(2)全部基因的数量
M为全部样本中,通路基因的数量
n为(1)抽取样本的数量,(2)在富集分析中为差异基因的数量
k为抽取样本中,通路基因的数量
对应到R语言的代码里面就是:
library(dplyr)
phyper(,,,) #富集度
pvalue=1-phyper(k,# 差异基因中,位于通路中基因数量
n, # 差异基因的数量
N-n, # 全部基因的数量 - 差异数量
M) # 全部基因中,位于通路中基因数量
说到这个程度还算不对?那我也没啥办法了