科研软件81难之4---GSVA的分析原理
2021-03-21 本文已影响0人
Seurat_Satija
寻亲报冤第四难
GSVA的分析原理
GSEA虽然是一种强大的富集分析工具,但是它的应用场景通常局限于Case/Control的实验设计。对于表型(分组)复杂的大样本量研究,例如TCGA和单细胞图谱这样的项目,分析起来就非常困难。因此,Broad研究所在GSEA发布8年之后,又开发了GSVA算法来拓展基因集分析的应用。GSVA不需要预先进行样本之间的差异分析,它依据表达矩阵就可以计算每个样本中特定基因集的变异分数。简单的说,输入以基因为行的表达矩阵和基因集数据库给GSVA,它就输出以基因集名称为行的变异分数矩阵,如下图所示:
左侧输入基因表达矩阵和基因集数据库,中间是GSVA算法原理,右侧是输出的基因集变异分数矩阵。基因集变异分数可以理解为基因集内所有基因的综合表达值。