生信学习生信数据库

GEPIA2使用教程

2021-12-08  本文已影响0人  Seurat_Satija

今天跟大家分享的是一个在线TCGA基因表达和生存分析的工具(GEPIA2),2019年发表在NAR上,目前已更新到2.0版本,访问网址是http://gepia2.cancer-pku.cn/#index,做TCGA数据的基因差异表达、相关性、预后等相关研究的小伙伴可以作为参考,结果和图可以直接导出。

GEPIA2: an enhanced web server for large-scale expression profiling and interactive analysis.

背景介绍和意义就不多说了,直接上使用说明,能进行基因差异表达分析,生存,泛癌中表达热图绘制,降维等,网站主页如图1所示。

图1 GEPIA网站主页

image
  1. 基因表达****的****一般性****分析

输入框中输入感兴趣的基因名,得到在不同组织中正常和癌症中的表达热图,如图2。继续往下拉会有散点图(图3)、柱图(图4),以及共表达基因列表。

image

图2基因表达的一般性展示

image

图3 基因表达散点图

image

图4 基因表达柱状图

  1. 差异表达分析

接下来是差异表达分析,下拉框选择癌症类型,筛选差异的阈值,筛选差异表达的方法,点击plot可得到差异基因的不同染色体分布(图5)。点击list得到差异基因列表(图6)。可以对差异结果进行下载。

image

图5 差异表达基因分布

image

图6 差异基因列表

  1. 表达****DIY

这个功能比较实用,点击expression DIY,会发现有四个功能,如图7所示。例如在

image

图7 expression DIY

往下拉可以输入基因名,差异的阈值和选中癌症类型,可以全选或者选择感兴趣的癌症类型,这里我们全选并点击add,点击plot,得到所有癌症与正常组织中的表达情况(图9)。

image

图8 表达DIY的选择

image

图9 癌症与正常基因谱

此外同样可以进行箱式图的绘制,选中感兴趣的癌症类型,方法类似,得到boxplot(图10)。可以下载pdf版本的图,以及DIY颜色配置。

image

图10 差异表达箱式图

对于不同肿瘤分期,添加需要研究的肿瘤类型,同样可以对不同的分期中基因表达进行分析(图11)。

image

图11.Aviolinplot

image

图11.B 不同分期基因表达violinplot

最后,可以对感兴趣的基因列表在多个癌症中以及正常组织绘制表达热图,输入感兴趣的基因列表,ctrl+鼠标左键选中癌症类型并点击add添加,点击plot即可出结果(图12,13)。且可以用鼠标框选后放大。

图12 多基因泛癌表达热图

image image

图13 多基因泛癌表达热图

  1. 生存分析

我们在研究基因表达与生存之间的关联时,输入基因名以及是OS还是RFS,以及自定义颜色等,点击add添加感兴趣的癌症类型,点击plot就可以得到最终的生存分析结果(图14,15)

image

图14 生存分析

image

图15 生存分析结果

如果不知道癌症中哪些基因与生存有关,点击mostdifferential survival genes,得到与生存有关基因的列表,可以进行结果下载(图16)。

image

图16 生存相关基因列表

若在多个想看多个基因在多个癌症中与生存的关联,可以利用survival map工具,输入基因列表和癌症列表,得到每个癌症中每个基因与生存的显著性p值(图17,18)

image

图17survival map

图18 泛癌中多基因生存p值热图

image
  1. Isoform分析

众所周知,一个基因存在多个转录本,我们对一个基因的不同的转录本的表达同样可以研究,以观测不同转录本的表达丰度(图19)。

image

图19 不同转录本的表达

  1. 相关****性分析

在计算基因或signature之间相关性时,我们可以利用该工具进行在线绘图,在这里,我们对两个signature进行相关性分析,得到基因集之间相关性图(图20)。

image

图20基因或基因集相关性分析

  1. 相似****基因****检测

在识别相似基因时,往往采用Pearson相关性进行度量,该工具可以输出按照相似性系数排秩的基因列表(图21)。

image

图21 相似基因列表

  1. PCA降维

由于基因数目较多,维度较大,对肿瘤进行可视化比较困难。利用主成分分析(PCA)进行可视化,这里以乳腺癌的正常和肿瘤为例,选择基因进行降维(图22)。可以得到每个主成分的方差贡献图(图23)。以及样本的二维和三维可视化(图24,25)。

image

图22 PCA降维

图23 主成分的方差贡献

image image

图24 二维可视化

image

图25 三维可视化

好了今天的数据库介绍就到这里了,希望该数据库对大家的TCGA数据分析以及结果展示提供一定的帮助

作者:概普生信
链接:https://www.jianshu.com/p/5c411eda8c7f
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

上一篇下一篇

猜你喜欢

热点阅读