箱线图的几种计算方法
2020-03-16 本文已影响0人
lazyM
一、绘制箱线图所需要的几个指标
q1:下四分位数
q2:中四分位数
q3:上四分位数
上限和下限:由q3和q1计算得出。
二、计算方法
1、“n+1”方法
来源:网络
(1)确定四分位数的位置。Qi所在位置=i(n+1)/4,其中i=1,2,3。n表示序列中包含的项数。
(2)根据位置,计算相应的四分位数
2、“n-1”方法
来源:网络
(1)确定四分位数的位置。Qi所在位置=i(n-1)/4,其中i=1,2,3。n表示序列中包含的项数。
(2)根据位置,计算相应的四分位数
3、“np”方法
来源:《概率论与数理统计》(浙大版)
(1)确定四分位数的位置。Qi所在位置np=(i*n)/4,其中i=1,2,3。n表示序列中包含的项数。
(2)如果np不为整数,Qi=X[np+1]
(3)如果np为整数,Qi=(X[np]+X[np+1])/2
三、示例
一组序列数为例:12,15,17,19,20,23,25,28,30,33,34,35,36,37
方法1:
Q1所在的位置=(14+1)/4=3.75,
Q1=0.25×第三项+0.75×第四项=0.25×17+0.75×19=18.5;
方法2:
Q1所在的位置=(14-1)/4=3.25,
Q1=0.75×第三项+0.25×第四项=0.75×17+0.25×19=17.5;
方法3:
Q1所在的位置=14*0.25=3.5,
Q1=19.
备注:spss中可能采用的是方法1(因为没有亲身验证过,只是网上有这种说法)。
四、smile简介
Smile (Statistical Machine Intelligence and Learning Engine) 是一个快速、全面的机器学习系统。受益于先进的数据结构与算法,Smile 有最一流的性能。
Smile 覆盖了机器学习的方方面面,包括分类、回归、聚类、关联规则挖掘、特征选取、流形学习(manifold learning,)、多维尺度分析(MDS)、遗传算法、missing value imputation、最邻近搜索等等。
Smile 有提供q1、q3等值的计算方法,但结果与上述有所不同。
仍以上述数据为例:
----------smile method ------------------------
q1==19.0
median==28.0
q3==34.0
----------n+1 method ------------------------
q1==18.5
median==26.5
q3==34.25
----------np method ------------------------
q1==19.0
median==26.5
q3==34.0