生存分析是什么
生存分析:分析不同实验条件下,研究对象“生存时间”的分布情况,从而了解实验条件对生存时间的影响。这里的“生存时间”不是专指人或动物的生命延续时间,而是泛指某个事件发生前的延续等待时间。之所以用“生存”分析这个名称,是因为这种分析技术常用于描述病人在接受某种治疗后,他们存活时间的分布情况。
事件及事件发生
事件是指研究者所关心的事件发生了,事件发生的时间点,也就是生存时间的记录终点
生存时间
生存时间是指从某一起点开始到所关心事件发生的时间。因为生存时间是生存分析的分析对象,所以对生存时间的长度确定至关重要。
删失/失访
删失是指事件发生未被观测到或无法被观测到以至于生存时间无法被准确记录下来的情况。删失分为右删失、左删失和期间删失三种。只知道生存时间大于某一时间点,这种删失称为右删失;只知道生存时间小于某一时点的删失称为左删失;只知道生存时间在某一段时间之内的删失称为区间删失,右删失的情况最为常见。虽然删失使得生存时间无法准确计算,但在生存分析时还是应该将其考虑在内,因为删失数据会影响到最终的生存率结果。
生存分析原理
生存分析刻画的是生存时间的分布情况,这里的分布指的是概率分布,如何形象刻画生存时间的分布情况呢?可以用一个二维坐标图来描述,横轴是时间长度,纵轴是事件发生概率,这就能很清楚的知道生存时间的概率分布情况了。
因为涉及到概率,那么自然要用概率函数来表示。根据计算概率的不同,生存分析的概率函数有两种:风险函数和生存函数。生存函数和风险函数是用来描述生存时间的分布的两个主要工具。
用一个非负随机变量T来表示生存时间,生存函数定义为随机变量T越过某个时点t时,所有考察对象中,没有发生事情的概率,也就是生存下来的概率。当t=0时,生存函数的取值为1,随着时间的推移(t值增大),生存函数的取值逐渐变小,生存函数是时间t的单调递减函数。
![](https://img.haomeiwen.com/i24181854/1f4a2b70338f1b13.png)
根据生存函数,又可以提出累积风险函数,它的公式为:
![](https://img.haomeiwen.com/i24181854/820c05d1bbd036d6.png)
表示生存时间T为超过时间点t时,研究对象中,已经发生事件的概率。
此外还有一个风险概率密度函数,它是累积风险函数的导数,公式如下:
![](https://img.haomeiwen.com/i24181854/02d618c2fb78fbc6.jpg)
风险概率密度函数表示某个时间点t上,事件发生的概率。
通过以上公式,最终我们可以得到风险函数,计算公式为:
![](https://img.haomeiwen.com/i24181854/209fcb947e7f3c2b.jpg)
表示生存时间T达到时间点t时,在接下来一瞬间,事件发生的概率。
从上面的结果可知,风险函数和生存函数是可以互相推导的,因此在生存分析中,既可以生存函数,也可以用风险函数,一般生存函数的运用更多。