SPSS统计分析R语言与统计分析

箱线图的几种计算方法

2020-03-16  本文已影响0人  lazyM

一、绘制箱线图所需要的几个指标

q1:下四分位数
q2:中四分位数
q3:上四分位数
上限和下限:由q3和q1计算得出。

二、计算方法

1、“n+1”方法

来源:网络

(1)确定四分位数的位置。Qi所在位置=i(n+1)/4,其中i=1,2,3。n表示序列中包含的项数。
(2)根据位置,计算相应的四分位数   

2、“n-1”方法

来源:网络

(1)确定四分位数的位置。Qi所在位置=i(n-1)/4,其中i=1,2,3。n表示序列中包含的项数。
(2)根据位置,计算相应的四分位数       

3、“np”方法

来源:《概率论与数理统计》(浙大版)

(1)确定四分位数的位置。Qi所在位置np=(i*n)/4,其中i=1,2,3。n表示序列中包含的项数。
(2)如果np不为整数,Qi=X[np+1]
(3)如果np为整数,Qi=(X[np]+X[np+1])/2

三、示例

一组序列数为例:12,15,17,19,20,23,25,28,30,33,34,35,36,37
    方法1:
    Q1所在的位置=(14+1)/4=3.75,
    Q1=0.25×第三项+0.75×第四项=0.25×17+0.75×19=18.5;  
    方法2:
    Q1所在的位置=(14-1)/4=3.25,
    Q1=0.75×第三项+0.25×第四项=0.75×17+0.25×19=17.5;  
    方法3:
    Q1所在的位置=14*0.25=3.5,
    Q1=19.

备注:spss中可能采用的是方法1(因为没有亲身验证过,只是网上有这种说法)。

四、smile简介

Smile (Statistical Machine Intelligence and Learning Engine) 是一个快速、全面的机器学习系统。受益于先进的数据结构与算法,Smile 有最一流的性能。
Smile 覆盖了机器学习的方方面面,包括分类、回归、聚类、关联规则挖掘、特征选取、流形学习(manifold learning,)、多维尺度分析(MDS)、遗传算法、missing value imputation、最邻近搜索等等。

Smile 有提供q1、q3等值的计算方法,但结果与上述有所不同。
仍以上述数据为例:

----------smile method ------------------------
q1==19.0
median==28.0
q3==34.0
----------n+1 method ------------------------
q1==18.5
median==26.5
q3==34.25
----------np method ------------------------
q1==19.0
median==26.5
q3==34.0
上一篇下一篇

猜你喜欢

热点阅读