四分位数 & 箱线图
2023-08-23 本文已影响0人
LET149
https://baike.baidu.com/item/%E5%9B%9B%E5%88%86%E4%BD%8D%E6%95%B0/5040599?fr=aladdin
指用三个数把一组数字从小到大分为4等份
- 四分位数包含以下三个数
- 下四分位数(Q1;第一四分位数;较小四分位数):靠近最小值一侧的四分位数
- 中四分位数(Q2;第二四分位数;中位数):处于中间的四分位数
- 上四分位数(Q3;第三四分位数;较大四分位数):靠近最大值一端的四分位数
1. 中四分位数
- 又称第二四分位数或中位数
- 计算方法:
- 把所有数字按照从小到大的顺序进行排序
- 如果数字个数为奇数,中位数为最中间的那个数字
- 如果数字个数为偶数,中位数为最中间那两个数字的平均值
- Note : 中位数对离群值不敏感,在对数字的特征进行描述时,可以避免离群值的影响
2. 下四分位数 & 上四分位数
- 计算方法
- 关于上下四分位数所处的位置的计算有多种,这几种方法最终的计算结果不会出现太大的差别
- 分位数位置计算方法一 :
- Q1的位置= (n+1)×0.25
- Q2的位置= (n+1)×0.5
- Q3的位置= (n+1)×0.75
- n 为数字个数
- 分位数位置计算方法二 :
- Q1的位置= 1 + (n-1)×0.25
- Q2的位置= 1 + (n-1)×0.5
- Q3的位置= 1 + (n-1)×0.75
- n 为数字个数
- Note : 以上的两种计算方法的计算结果中有整数也有小数,如果是整数则就是那个数,如果是小数则由此小数两侧的整数加权算得
- 当上下两个分位数的位置为小数时,这两个分位数的计算方法如下:
- 假设下四分位数的位置为7.25,按从小到大排列数字后,第7位数为20,第8位数为33
- 此时的下四分位数为:20x(1-0.25)+33x(0.25) = 23.25
- 注意权重的使用
3. 箱线图
https://blog.csdn.net/clairliu/article/details/79217546
箱线图用来直观描述数据的四分位情况
- 箱线图主要包括以下几个元素
- 中位数
- 上四分位数
- 下四分位数
- 上限
- 下限
- 异常值
- 四分位距(IQR):上四分位数与下四分位数之间的距离
- IQR = Q3 - Q1
3.1 上限
上限 = Q3 + 1.5IQR
3.2 下限
下限 = Q1 - 1.5IQR
3.3 异常值
- 所有处于上限和下限之外的数都是异常值
- 画箱线图时,所有的异常值都要被画出