生统笔记7-生存分析之KM曲线
2024-09-27 本文已影响0人
江湾青年
定义
-
Kaplan-Meier(KM)曲线是一种描述性统计工具,用于估计生存函数的非参数统计方法。不需要建立和求解模型
-
KM曲线仅依赖于生存时间和事件状态,不考虑其他协变量。适合单变量分析或描述性研究。
KM曲线的绘制
-
将所有事件发生的时间点按升序排列,并记录在这些时间点发生的事件数和仍然生存的个体数。
-
计算生存概率:对于每个时间点 t,计算生存概率 S(t)
-
初始化:在第一个时间点,生存概率 S(0) 通常设定为1
-
对所有时间点重复上述步骤,逐步更新生存概率,直到最后一个时间点
-
绘图
KM曲线的置信区间
-
生存函数估计
Kaplan-Meier方法通过处理生存数据(如事件发生的时间和状态)来估计生存函数 S(t),即在时间 t 之前生存的概率。该方法根据每个事件(如死亡)和每个时间点的生存个体数进行计算。 -
标准误差的计算
理论依据
-
二项分布的近似:KM方法假设生存概率遵循某种二项分布,当个体在每个时间点的生存状态相互独立时,事件的发生可以视为一个二项试验。
-
中心极限定理:当样本量较大时,生存概率的分布可以近似为正态分布。SE的计算正是基于这种近似,以估计生存概率的不确定性。
两组生存时间的差异检验
Log-Rank检验,通常称为“对数秩检验”。
步骤:
-
提出假设:零假设(H0):两组生存曲线无显著差异。对立假设(H1):两组生存曲线有显著差异。
-
计算期望事件数:对于每个时间点,计算各组的期望事件数,使用以下公式:
- 计算Log-Rank统计量
- 使用卡方分布查找相应的p值。