TCGA-流程收入即学习TCGA GEO

TCGA学习04:建模预测-cox回归

2020-05-08  本文已影响0人  小贝学生信

TCGA学习01:数据下载与整理 - 简书
TCGA学习02:差异分析 - 简书
TCGA学习03:生存分析 - 简书
TCGA学习04:建模预测-cox回归 - 简书
TCGA学习04:建模预测-lasso回归 - 简书
TCGA学习04:建模预测-随机森林&向量机 - 简书

第四步:建模预测

根据某些临床信息以及感兴趣的基因表达,来建立用于预测生存概率的模型,方法参考花花老师教程有以下四种。

法1:COX回归

Cox比例风险回归模型(Cox proportional hazards regression model)的特点是可以进行多变量分析;且变量类型不限于二分类变量,也可以是连续型变量。

1、建模
#加载数据、包
load("tosur.RData")
library(survival)
library(survminer)

#这里暂时考虑了三个因素
s=Surv(time, event) ~ gender + tumor_stage + age_group 
# coxph建模
model <- coxph(s, data = meta )
summary(model)

观察下图的summary结果,先重点关注下一下内容

summary(model)
2、绘制森林图
ggforest(model, data = meta, 
         main = "Hazard ratio",   #森林图的标题
         cpositions = c(0.10, 0.22, 0.4),   #调整前三列的距离,防止过宽或过窄(重叠)
         fontsize = 1.0, 
         refLabel = "1",   #相对变量的数值标签
         noDigits = 4     #保留HR值以及95%CI的小数位数
)   

此外森林图左下角会给出出现结局事件的个数,COX生存模型的P值,AIC值和C-index值。关于C-index这里扩展一下--

3、C-index
fp <- predict(model)
fp   #模型预测521个样本预测的生存概率
c_index1=summary(model,data=meta)$concordance[[1]]
# 或者Hmisc的rcorr.cens函数,结果都一样
c_index2=1-with(meta,rcorr.cens(fp,Surv(time, event)))[[1]]
# 或者直接在森林图左下角看出
C-index值

花花老师在这篇文章里,还介绍了一个关于cox的风险因子三联图,暂时还没有太理解。存此下~


参考文章
1、TCGA数据分析流程梳理总结(含目录) - 简书
2、生存分析之Cox比例风险模型 - 简书
3、R语言之生信⑧Cox比例风险模型(多因素) - 简书
4、R语言之生信⑦Cox比例风险模型(单因素) - 简书
5、生存分析(Survival Analysis)、Cox风险比例回归模型(Cox proportional hazards model)及_人工智能_dqhl1990的博客-CSDN博客
6、生存模型的C-index(C指数)_JavaScript_FanJin的博客-CSDN博客

上一篇 下一篇

猜你喜欢

热点阅读