四分位数 & 箱线图

2023-08-23  本文已影响0人  LET149

https://baike.baidu.com/item/%E5%9B%9B%E5%88%86%E4%BD%8D%E6%95%B0/5040599?fr=aladdin

指用三个数把一组数字从小到大分为4等份

  • 四分位数包含以下三个数
    1. 下四分位数(Q1;第一四分位数;较小四分位数):靠近最小值一侧的四分位数
    1. 中四分位数(Q2;第二四分位数;中位数):处于中间的四分位数
    1. 上四分位数(Q3;第三四分位数;较大四分位数):靠近最大值一端的四分位数

1. 中四分位数

  • 又称第二四分位数或中位数
  • 计算方法:
    1. 把所有数字按照从小到大的顺序进行排序
    1. 如果数字个数为奇数,中位数为最中间的那个数字
    1. 如果数字个数为偶数,中位数为最中间那两个数字的平均值
  • Note : 中位数对离群值不敏感,在对数字的特征进行描述时,可以避免离群值的影响

2. 下四分位数 & 上四分位数

  • 计算方法
  • 关于上下四分位数所处的位置的计算有多种,这几种方法最终的计算结果不会出现太大的差别
  • 分位数位置计算方法一 :
  • Q1的位置= (n+1)×0.25
  • Q2的位置= (n+1)×0.5
  • Q3的位置= (n+1)×0.75
  • n 为数字个数
  • 分位数位置计算方法二 :
  • Q1的位置= 1 + (n-1)×0.25
  • Q2的位置= 1 + (n-1)×0.5
  • Q3的位置= 1 + (n-1)×0.75
  • n 为数字个数
  • Note : 以上的两种计算方法的计算结果中有整数也有小数,如果是整数则就是那个数,如果是小数则由此小数两侧的整数加权算得
  • 当上下两个分位数的位置为小数时,这两个分位数的计算方法如下:
  • 假设下四分位数的位置为7.25,按从小到大排列数字后,第7位数为20,第8位数为33
  • 此时的下四分位数为:20x(1-0.25)+33x(0.25) = 23.25
  • 注意权重的使用

3. 箱线图

https://blog.csdn.net/clairliu/article/details/79217546

箱线图用来直观描述数据的四分位情况

  • 箱线图主要包括以下几个元素
    1. 中位数
    1. 上四分位数
    1. 下四分位数
    1. 上限
    1. 下限
    1. 异常值
  • 四分位距(IQR):上四分位数与下四分位数之间的距离
  • IQR = Q3 - Q1
3.1 上限

上限 = Q3 + 1.5IQR

3.2 下限

下限 = Q1 - 1.5IQR

3.3 异常值
    1. 所有处于上限和下限之外的数都是异常值
    1. 画箱线图时,所有的异常值都要被画出
上一篇 下一篇

猜你喜欢

热点阅读