SAS编程

321:几何均值和几何CV的计算方法

2024-03-19  本文已影响0人  SASPRO的打工人生活

一:几何均值

几何均值的计算公式如下

ln(xi) 表示数值 xi 的自然对数,exp⁡ 表示指数函数。

这个公式可以简单解释成先对每个值取自然对数,接着对这些对数值取算术平均数;最后再对这些取了均值的算术平均数进行反对数变换,就得到了几何均值。

在SAS中的实现

ln(xi)在SAS中可以直接通过log(x)实现,这已经是以e为底;如果需要以10为底,那就是log10(x)了。

至于指数函数,在SAS中是exp函数,至于什么是反对数变换,我已经记不清了。大家知道怎么用就可以了。

所以有了公式,我们就知道我们需要什么了,需要注意的是,需要先对数据进行log变换(看公式)。

data class;

set sashelp.class;

if height>0 then log_height=log(height);  *实际工作中我们的数据可能存在等于0或者小于0的,需要排除;

proc sort;by sex;

run;

*几何均值--方法一;

proc means data=class noprint;

by sex;

  var log_height;

  output out=dat_mean mean=mean_log;

run;

data dat_mean2;

set dat_mean;

geomean=exp(mean_log);

run;

最后我们就得到了两组的几何均值。当然根据公式,我们可以直接在proc sql里面直接计算。可以看到计算的结果是一样的。

*几何均值--方法二;

proc sql;

create table  geomean as

  select sex,exp(mean(log(height))) as geomean from class(where=(height>0))

  group by sex;

quit;

二:几何CV

几何CV(几何变异系数),描述数据变异程度的,计算的公式如下

剖析一下公式,这时候不需要先对数据进行log变化,直接用原始值,接着计算数据的均值和标准差,这时候再加1进行log变化。

proc means data=class noprint;

by sex;

var height;

  output out=geocv mean=mean_log std=std_log;

run;

data geocv2;

  set geocv;

  geocv = (exp(sqrt(log(1 + (std_log**2)/(mean_log**2)))) - 1)*100;

run;

同样的,几何CV也可以直接用proc sql直接计算出来,你们可以把上面的公式一步一步转换成程序,但是这里还有一个公式,可能是经过一些特殊转换,这样也能计算出几何CV。

proc sql noprint;

create table GEOCV3 as

select sex,100*sqrt(exp(log(exp(std(log(height))))**2)-1) as GEOCV  from class(where=(height>0))

group by sex;

quit;

也听过用proc ttest计算的,但是我看只算出了SD和mean,可能还是需要用公式计算

proc ttest data=class;

by sex;

  var height;

run;

这里提一下,我们在计算CV和geocv的时候,可能会看到后面的单位跟着一个%(但是实际上他们是一个无单位的比率),CV的计算公式是标准差除以均值。

但是SAS在计算CV的时候,已经给我们乘以了100,所以你不要看到%又乘以了100,但是几何CV需要再乘以100。

上一篇下一篇

猜你喜欢

热点阅读