描述性统计
2019-07-21 本文已影响0人
矛头煎堆
集中趋势
反应了数据向其中心值聚集的程度,是对数据一般水平的概括性度量
- 众数
- 平均数
- 中位数
- 中程数
适用范围
分类 | 数值数据 | 顺序数据 | 分类数据 |
---|---|---|---|
众数 | √ | √ | |
中位数 | √ | √ | |
平均数 | √ | ||
离散趋势
反映了数据远离中心值的程度,是衡量集中趋势值对整个数据的代表程度,数据离散度越大,说明集中趋势值的代表性越低
- 方差
- 标准差
- 极差
- 平均差
- 四分位数
- 异众比率
- 离散系数
适用范围
类别 | 数值数据 | 顺序数据 | 分类数据 |
---|---|---|---|
极差 | √ | ||
平均差 | √ | ||
方差(标准差) | √ | ||
四分位差 | √ | √ | |
异众比率 | √ | √ | |
分布的形状
-
偏态系数
统计总体当中的变量值分别落在众数的左右两边,呈非对称性分布。指非对称分布的偏斜状态。
-
峰态系数
表征概率密度分布曲线在平均值处峰值高低的特征数。直观看来,峰度反映了尾部的厚度