平均数与中位数

2019-04-12  本文已影响0人  爱子酱的猫

我们知道,平均数是统计中的一个概念,目的是确定一组数据的均衡点,用来表示统计对象的一般水平。

而中位数它代表的是一个样本、种群或概率分布中的一个数值,这个数值可以将这组数据划分为相等的上下两部分。

在描述数据的时候,我们通常会通过平均数与中位数来认识数据。但有些时候,哪怕我们准确无误的计算出了平均数,也无法改变中位数在对真相的描述中更加准备这个事实。

为什么这么说呢?

首先,我们关心的多大数现象都可以用多种方式进行描述。但同样的,当我们在对同一事物进行描述的时候,我们说的话(选用的数据)便会影响别人对此事的印象。

之前在一片文章里面,我有谈过数据的信度与效度问题。如果一个答案是准确的,那么在这个基础上当然是越精确越好。但如果答案从一开始就是不准确的,那么即使再精确也毫无意义。

恰好,平均数就是一个不那么准确的数据指标。

因为平均数会受到这组数据里面极值的影响。

比如3、4、5、6、102这5个数字,它们的平均数是24,而中位数是5。很明显,24和5之间存在明显的差距。

但你说这两个数据都不可用么?这也未必。

有些时候,你想让整体的数字看起来更大,就用平均数。如果你想让整体数字看起来更小,那就用中位数。

这时,就很容易误导看数据的人。

因为一看到你的平均数这么大,很自然的就会认为你的东西不错。其实不是的。因为这组数据的平均数之所以这么大,完全是因为102这个极值拉大了整体的均值,所以平均数看起来还不错。

只是这样的话,便会对数据产生一定的误解。

因此,从这个角度出发,当我们要准确的认识数据的时候,要尽可能避免使用平均数来作为判断对象好坏的唯一标准,我们得加入中午数据,使得结论更加准确。

上一篇 下一篇

猜你喜欢

热点阅读