2. 数据的常用表示方法
2019-06-05 本文已影响0人
迪丽娜扎
1. 类别变量的常用表示:
1.1 指标:一般也就两种:频数分布、占比分布
1.2 图形展示:可以用直方图、帕累托图(按频数或占比从高到低排列的直方图)、饼图、环形图(同时考察多个类别变量的复合饼图)
类别变量没什么可说的
2. 定量数据的常用表示
2.1 指标:先分箱(又称分组),然后也就频数分布和占比分布两种了
2.2 图形展示:
2.2.1 分组后的:直方图
2.2.2 不分组的:茎叶图、箱线图、垂线图、误差图等。
实际上,在机器学习的特征分析方面,使用最多的是用直方图看特征的分布情况。其它用得较少。
3. 两个变量间关系
常用图示:散点图,能直观看出两个变量值间的关系