GSEA详细解释及结果解读
2020-11-12 本文已影响0人
像鸟一样飞过你的高山
Gene Set Enrichment Analysis (基因集富集分析)用来评估一个预先定义的基因集的基因在与表型相关度排序的基因表中的分布趋势,从而判断其对表型的贡献。其输入数据包含两部分:已知功能的基因集 (可以是GO注释、MsigDB的注释或其它符合格式的基因集定义);表达矩阵 (也可以是排序好的列表)。
软件会对基因根据其与表型的关联度(可以理解为表达值的变化)从大到小排序,然后判断基因集内每条注释下的基因是否富集于表型相关度排序后基因表的上部或下部,从而判断此基因集内基因的协同变化对表型变化的影响。
GSEA分析结果如下表
![](https://img.haomeiwen.com/i22547207/bc9500a644841616.png)
- ID: GO编号
- Description: GO分类的名称
- setSize:该GO条目中包含表达数据集中的基因数目
- enrichmentScore:富集评分
- NES:校正后的归一化的ES值
由于不同用户输入的基因数据库文件中的基因集数目可能不同,富集评分的标准化考虑了基因集个数和大小。 - pvalue:富集得分ES的统计学显著性水平,用来表征富集结果的可信度
- p.adjust:'BH' 校准后的P值
GSEA可视化结果如下图
![](https://img.haomeiwen.com/i22547207/f967668afda1b6c4.png)
- Enrichment Score折线部分,横轴为排序后的基因,纵轴为对应的Running ES, 在折线图中有个峰值,该峰值就是这个基因集的Enrichemnt score,峰值之前的基因就是该基因集下的核心基因。
- 中间部分线条标记位于该基因集下的基因
- 第三部分为所有基因的rank值分布图。
下图展示了clusterProfiler包GSEA分析可视化结果,Count为核心基因的数目,GeneRatio为Count与setSize的比值,Y轴为基因集Description。
![](https://img.haomeiwen.com/i22547207/ff96edcf1bc3d899.png)