数据分析学习Day1---商务与统计(第二章)
2018-11-08 本文已影响0人
ghostdogss
1.帕累托直方图:定性变量的类别对应的条形高度从左到右按降序排列。
2.描述定量数据的图形方法:点图、茎叶图、直方图。
3.集中趋势的测度:就是测度数据聚集的趋势或某些数据的中心(均值,中位数,众数等 );
数据的变异性测度:就是测速数据的分散状况(极差,样本方差)。
![](https://img.haomeiwen.com/i14870522/cfd43fcb5c270c23.png)
4.均值、中位数与有偏
![](https://img.haomeiwen.com/i14870522/7bf435b73594a2e4.png)
5.众数组(即分组内包含的个体数量最多)的众数是众数组的中点。
6.利用均值与标准差描述数据
![](https://img.haomeiwen.com/i14870522/5e066d1d301efc92.png)
![](https://img.haomeiwen.com/i14870522/209d2cc4d0439cf1.png)
7.相对位置的测度:分位数或者z得分
![](https://img.haomeiwen.com/i14870522/db33e4184affc29e.png)
![](https://img.haomeiwen.com/i14870522/b4dd3085bf1fe153.png)
8.异常值的检测方法:(1)箱线图:内栏位为上下端的1.5倍四分位差,内栏以外的值位潜在的异常值;外栏位为上下端3倍四分位差,如超过外栏则说明其是异常值。(2)z得分,得分绝对值大于2认为是潜在异常值,得分绝对值大于3认为是异常值。