分位数与箱线图

2019-06-16  本文已影响0人  不玩手机的蛇佬腔

1.概念

    统计学术语,如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。可表示为:一组n个观测值按数值大小排列如,处于p%位置的值称第p百分位数。
    比如,中位数就是第50百分位数,第25百分位数又称第一个四分位数(First Quartile),较小四分位数,用Q1表示;第50百分位数又称第二个四分位数(Second Quartile),用Q2表示;第75百分位数又称第三个四分位数(Third Quartile),较大四分位数,用Q3表示。若求得第p百分位数为小数,可完整为整数。第三四分位数与第一四分位数的差距又称四分位距(InterQuartile Range,IQR)第p百分位数是这样一个值,它使得至少有p%的数据项小于或等于这个值,且至少有(100-p)%的数据项大于或等于这个值

2.计算过程

    数字按从小到大排序,主要选择四分位的百分比值p,及样本总量n有以下数学公式可以表示:
L_{p}=n*\frac{p}{100}

3.例子

    高等院校的入学考试成绩经常以百分位数的形式报告。比如,假设某个考生在入学考试中的语文部分的原始分数为54分。相对于参加同一考试的其他学生来说,他的成绩如何并不容易知道。但是如果原始分数54分恰好对应的是第70百分位数,我们就能知道大约70%的学生的考分比他低,而约30%的学生考分比他高。
    假如:有10个数:1、2、3、4、5、6、7、8、9、10 按由小到大将其排列。求它的第90%百分位,也就是第9个数刚好是9 ,那么90%分位数就是9 。例子来自我是攻城狮

4.箱线图

箱线图就是四分位数的可视化表现


boxplot.jpg

所以通过这个图可以看到一组数据的分布状态。

上一篇 下一篇

猜你喜欢

热点阅读