截断五式第四式:多参可选
2020-12-27 本文已影响0人
灵活胖子的进步之路
之前分享的几种方法都无法控制自变量及因变量最小组的比例。比如,连续变量分组后,可能会出现一组病例数就几个,而另一组几百个的情况;另外,一般软件的截断值只能根据截断值个数列出“最优解”,而不能列出多重种情况可供选择
以下的主要参数选择依据
主要参数主要参数续
library(cutoff)
str(mtcars)
数据集结构
res1<- logrank(data=mtcars,
time = 'disp',#数据集
y='am', #自变量
x='wt',#因变量
cut.numb=2,#截断值选择个数
n.per=0.25,#x最小组个数比例
y.per=0.10)#y最小组个数比例
View(res1)
结果展示,可以看到不同截断值选择有不同的分组比例及P值
以下展示完整参数用法
res2<- logrank(data=mtcars,
time = 'disp',
y='am',
x='wt',
cut.numb=2,
n.per=0.25,
y.per=0.10,
p.cut=0.05,#P值选择
strict=TRUE,#是否严格两两分组均有意义才能纳入
include='low',#分组截断值纳入哪个分组,low为纳入低数值组
round=2)#小数位数
View(res2)
结果