2018-08-14-Python数据科学第四章
2018-08-14 本文已影响12人
丨像我这样的人丨
描述性统计分析与绘图
变量的度量类型
数值型变量
类别型变量
有序 有大小、高低、次序之分 如用户满意度打分(五星)
无序 没有大小、高低、次序之分 如省份、性别
统计量
类别型
无序:频次、百分比
有序:频次、百分比、累计频次、累计百分比
数值型
四类统计量 分别用于描述数据的集中趋势、离中趋势、偏态程度、尖峰程度
集中趋势:平均数、中位数、众数
左偏分布:均值<中位数<众数
右偏分布:众数<中位数<均值
离散程度:极差、方差、标准差
max()-min()
var()
std()
偏度与峰度(高矮胖瘦)
skew()
kurtosis()