差异表达分析基本原理与方法
2018-07-25 本文已影响346人
Thinkando
差异表达分析的本质就是:识别差异表达基因和非差异表达基因
筛选方法: 倍数法,t检验法,方差分析,SAM法,信息熵
1. 倍数法
- case 每个基因的表达量 a
- control 每个基因的表达量 b
- f = a/b
- 缺点: 阈值很难确定,一般取2
- f 和1越接近,说明没有差异表达,大于1 说明上调,小于1说明下调,通常被用于基因的大规模初筛
2. t检验
image.png-
缺点: 由于芯片实验成本较高,n 较少,从而对总体方差估计不很准确,t检验得分检验效能降低。用随机方差弥补样本量太少。
image.png
3. 方差分析
-
其实就是在t 检验的基础上增加了一组组内的变异检测的校正。
image.png
4. SAM 法
-
多重假设多了(假设检验次数多了),p值再小,也会有假阳性率发生P=1-(1-p)^ n,所以需要纠正
image.png
image.png
5. 信息熵
-
我个人觉得这方法没什么意义,请高人指点指点!
image.png