RNA-SEQ(八):GSEA富集分析
2023-02-27 本文已影响0人
生信小白花
做分化过程中cAMP信号通路的GSEA富集分析
Gene Set Enrichment Analysis (基因集富集分析)简称GSVA,由麻省理工学院和哈佛大学研究团队2005发表在Proc Natl Acad Sci U S A.提出来的一个基因功能富集方法,目前已经引用2万多次,可谓是做基因富集分析的常用工具[。同时GSEA官网在windows平台和MAC平台上也提供一个可视化的软件,只需点击鼠标即可完成。
目的:转录组测序数据通过KEGG富集分析得到一些关键通路,但这些通路的变化情况却不太清楚。GSEA可以得到通路的上下调信息。
数据:人类基因组图谱背景文件,分组信息,counts矩阵,信号通路注释信息。
-
.gct文件是在counts矩阵中增加一列NA,增加两行,第一行#1.2,第二行分别是基因数目和样本数目,每个样本名也要改成CON前缀和ALL前缀(这个可以自定义,但要和后面的.cls文件统一)。全部改好后将文件名后缀改成.gct
image.png -
.cls如下,手动整理的,6 2 1分别是总样本数,组别(实验组和对照组两组就为2),1是固定的。
image.png -
.gmt文件是在GSEA官网下载的信号通路注释信息,这个文件也可以根据自己的需求筛选出想要的通路。
image.png -
.chip文件也直接在官网下载,不用更改。
软件:GSEA软件下载:http://software.broadinstitute.org/gsea/downloads.jsp 要下载到Java,这个是在Java基础上运行的软件,根据你的数据大小,选择不同内存的版本,2G内存开始的GSEA版本需要的是64位的Java 1.8版。
步骤:
-
导入所有数据。
image.png -
输入所需的文件,并且设置输出文件。
image.png -
点击Run运行。
结果:
image.png