proc means求计量资料的95%CI
有时候会经常遇到计量资料(定量资料)和计数资料(分类资料),不同的资料采用的统计方法也不相同,所以有必要先搞清楚什么是计量资料和计数资料。
计量资料指连续的数据,通常有具体的数值,如身高、体重、血压、血红蛋白、胆红素和白蛋白等。计量资料的特征通常包括中心位置与离散程度。
计数资料是指先将观察单位按其性质或类别分组,然后清点各组观察单位个数所得的资料。特点是对每组观察单位只研究其数量的多少,而不具体考虑某指标的质量特征,属非连续性资料。
说到这些我也头痛,自己理解吧,理解不了就靠猜~~
今天讲讲如何用proc means求计量资料的95%CI,比如说身高、体重、年龄等。我们以SASHELP.CLASS为原数据集,以sex当作组别(trt01an)
我们先用proc univariate输出一些东西看看,其实这也是可以求95%CI的,但是不是我们讨论的重点,我想让你们看看输出。
这个CIBASIC选项就代表你要求95%CI,你也可以指定(alpha=0.1)
在proc univariate中,我输出了均值、标准差、最大值最小值、四分位数,而且basicintervals=ci 还不能直接在output out输出,奇了怪了。
看到对每一个统计量,比如说Mean、Std Deviation、Variance都有lowerCL,UpperCL,我当时就蒙圈了,这么多,该取哪一个统计量的呢?shell上也没说啊?后来我一看SAP,里面有讲到平均数的95%CI,所以也就是我圈起来的那个。这个estimate就代表SEX="F"的年龄均值是13.222。
方法一:
这是今天从网上了解的,想不到还可以这样求。这种方法感觉像是手算,先求出均值mean和n,然后加上tinv这个函数去计算可置信区间的上下限。tinv我不知道,没时间去了解。自己去官网看看。
看到跟proc univariate计算出来的值是一样的,我想如果把Mean换成STD,求出来的应该就是Std Deviation的95%CI了,感兴趣可以自己试试。
方法二:其实可以直接在proc means里面求出,一个lclm,一个uclm就搞定了。
输出结果是一样的
方法三:proc summary,其实跟proc means差不多。
综上,其实有4种方法,不同方法有点差异,看自己取舍吧。
******************************************
今天内心真的抗拒工作,昨天跑步过度了,快10点就睡了,结果睡了快9个小时还是被闹钟给叫醒的。工作也是心烦,人真的要忙忙碌碌一辈子?
我现在正循环播放这《大悲咒》~~~~~有时候想想出家算了,但是感觉自己还是俗人一个,断不了爱恨贪嗔。