2. 数据的常用表示方法

2019-06-05  本文已影响0人  迪丽娜扎

1. 类别变量的常用表示:

1.1 指标:一般也就两种:频数分布、占比分布

1.2 图形展示:可以用直方图、帕累托图(按频数或占比从高到低排列的直方图)、饼图、环形图(同时考察多个类别变量的复合饼图)

类别变量没什么可说的

2. 定量数据的常用表示

2.1 指标:先分箱(又称分组),然后也就频数分布和占比分布两种了

2.2 图形展示:

2.2.1 分组后的:直方图

2.2.2 不分组的:茎叶图、箱线图、垂线图、误差图等。

实际上,在机器学习的特征分析方面,使用最多的是用直方图看特征的分布情况。其它用得较少

3. 两个变量间关系

常用图示:散点图,能直观看出两个变量值间的关系

上一篇下一篇

猜你喜欢

热点阅读