R语言与统计分析

截断五式第四式:多参可选

2020-12-27  本文已影响0人  灵活胖子的进步之路

之前分享的几种方法都无法控制自变量及因变量最小组的比例。比如,连续变量分组后,可能会出现一组病例数就几个,而另一组几百个的情况;另外,一般软件的截断值只能根据截断值个数列出“最优解”,而不能列出多重种情况可供选择

以下的主要参数选择依据

主要参数
主要参数续
library(cutoff)
str(mtcars)
数据集结构
res1<- logrank(data=mtcars,
        time = 'disp',#数据集
        y='am', #自变量
        x='wt',#因变量
        cut.numb=2,#截断值选择个数
        n.per=0.25,#x最小组个数比例
        y.per=0.10)#y最小组个数比例
View(res1)
结果展示,可以看到不同截断值选择有不同的分组比例及P值

以下展示完整参数用法

res2<- logrank(data=mtcars,
        time = 'disp',
        y='am', 
        x='wt',
        cut.numb=2,
        n.per=0.25,
        y.per=0.10,
        p.cut=0.05,#P值选择
        strict=TRUE,#是否严格两两分组均有意义才能纳入
        include='low',#分组截断值纳入哪个分组,low为纳入低数值组
        round=2)#小数位数
View(res2)
结果
上一篇 下一篇

猜你喜欢

热点阅读