生信在线工具科研神器GEO&TCGA数据库挖掘

最全的生存分析网页版工具,你掌握了吗

2019-03-29  本文已影响40人  765f2ea50d22

本文首发于 ”百味科研芝士“ 微信公众号,转载请注明:百味科研芝士,Focus科研人的百味需求

点击蓝字关注我们

想研究疾病OS,PFS,DFS?

想研究预后如何制作生存曲线?

百味科研芝士今日为你盘点几款生存曲线制作方法。

第一款:Kaplan-Meier Plotter数据库

★★★★☆

Kaplan-Meier Plotter数据库这是今天推荐首款生存曲线制作方法,官网(http://kmplot.com/analysis/),它是长的这个样子的。

乍一看,Kaplan-MeierPlotter数据库似乎只能研究6个癌种,小编之前也犯了同样的错误,“pan-cancer”(pancreatic cancer,胰腺癌像不像?)。其实,“pan-cancer”是画中有画,不信咱打开瞧瞧!

先看看mRNA表达谱,还有不下20个癌种可供研究,而主页上面的五个癌种的信息是比较详细的。同样,也可以查看miRNA表达谱的“pan-cancer”,包含的癌种也有20种。

Kaplan-MeierPlotter数据库的数据来源于GEO(仅限Affymetrix微阵列),EGA和TCGA,缺点是每个数据库每两年更新一次。走起来~

点击癌种“LungCancer”,左上的搜索框输入“KRAS”,默认参数。

下拉页面,点击“Draw  Kaplan-Meier Plotter”,简单粗暴,出图!

最后,我们看看参数设置吧,在“survival”这里可以选择患者的总生存期(OS)、首次进展生存期(FP)、再次进展生存期(PPS)。而对于随访时间的终点也可以设置,在“Survival”菜单下面的“Follow up threshold”里面。

接着,看看其他参数设置,左上角是探针设置,根据自己的研究选择不同的探针。病理参数里面可以设置病理类型、分级、分期、T、N、M、性别、吸烟史。在治疗分组中,也可以看不同治疗的预后。而数据集里面也囊括了TCGA以及GEO的芯片数据。最后的COX分析也可以选择单因素和多因素分析。

通过参数设置,我们可以分析不同亚组、不同病理参数、不同治疗模式、不同数据集的患者预后,由此也看出来Kaplan-Meier Plotter数据库的强大。

第二款:SPSS软件

★★★★★

SPSS软件制作生存曲线是最经典的做法,只要你有数据就能做,就是不熟悉SPSS的孩纸会感觉稍稍复杂。直接上数据吧!假定:分组信息(0低表达;1高表达)、存活状态death(0存活;1死亡)、生存时间month(月)。

数据录入完成后,依次点击分析→生存函数→Kaplan-Meier

参数设置:time-时间,death-状态,点击定义事件(终点时间设置为1死亡)

设置检验统计量:对数秩、Breslow

选项里面点击生存函数

直接出图!当然,这个图在SPSS中可以进行简单修改,可以试一试!

第三款:GraphdPad Prism软件

★★★★☆

GraphdPad Prism软件是一款超级好用的专业医学绘图软件,在医药生物领域被广泛使用,拥有ROC曲线分析、Bland-Altman分析功能以及GraphPad Prism的线性/非线性拟合功能,所以,制作生存曲线对它来说只是小菜。

首先,录入数据,注意它与SPSS的输入区别,即实验组(EXP)和对照组(CON)输入在不同的两列中。

点击Graphs中的Data 1,右侧即显示制作好的生存曲线。

调色:鼠标双击其中一条曲线,更改颜色后点击OK。

下面是更换颜色后的图,看着还不错~

图还行,貌似缺点东西,P值!点击菜单栏中“Analyze”,选择“survival curve”,然后点击OK。

直接查看P值及其他数据。相比SPSS来说,略显麻烦,但是对图形的修改,还算不错,有机会下次为大家推送GraphdPad Prism

第四款:UALCAN网站

★★★★★

UALCAN(http://ualcan.path.uab.edu/index.html)主要是基于TCGA数据库中的相关癌症数据进行分析的网站,操作仍然是简单粗暴,先看主页。

开始表演了~抖一下“Analysis”,方框里面根据需要更改。

点一下“Explore”,继续点“Show all gene expression in same page”,别停!接着点“Survival”,完事儿!

话说这图出的真惊喜,连续好几张(不试后悔)!必须给五星! 

第五款:GEPIA网站

★★★★★

GEPIA在百味里面推送过(传送门:

GEPIA:点点鼠标分析TCGA数据-超高自由度

),官网(http://gepia.cancer-pku.cn/)

收索框中输入基因,点击“Survival Analyze”。

跳转页面,在下图红框里面选择一个肿瘤患者数据集,比如“LUAD”。

点击下方“Plot”,出图~666。

第六款:cbiportal网站

★★★★★

这个网站(https://www.cbioportal.org/)大家太熟悉了,不再多说!点击链接直接查看推文:

懒人如何分析TCGA数据之cBioportal网站

第七款:Oncolnc网站

★★★★★

既然是“Party”,那就再来介绍一个网站好了!OncoLnc,也是一款基于TCGA数据预后分析网站,官网网址:http://www.oncolnc.org/。

输入基因名:可以是基因名,也可以输入mRNA,microRNA和lncRNA。

点击“Submit”后,查看结果~页面如下,显示了肿瘤类型、回归系数、P值、基因表达水平等参数。

比如选择肺腺癌后,点击“Yes Please!”在这个页面比如选择低位4分位和高位4分为的表达量,也就是25:25,当然,也可以选择50:50也就是取中位数。

点击提交,生存曲线就做好了,直接导出PDF保存。

下拉页面,保存生存分析的数据,分析结束。

第八款:R软件

★★★★☆

R语言做生存曲线作为今天的压轴方法,在这里以TCGA数据库中的数据为例,分析差异基因表达情况与患者的生存关系。

首先用hash函数从矩阵normalizeExp.txt中提取TOP2A的基因表达量。

将基因表达量与生存文件time文件整合

survival函数制作生存曲线

出图~学会了吗?

纵观这些软件或数据库,都各有千秋,根据需要,可以任意选择。小编今天总结了常见的制作生存曲线的八种方法,然而,制作生存曲线的方法远不止这些,小伙伴们,跟帖吧~

End

上一篇 下一篇

猜你喜欢

热点阅读