Excel - Lesson 3 - 可视化数据
目录
- 1. 饼图(Pie Charts)
- 2. 条形图(Bar Charts)
- 3. 散点图(Scatter Plots)和线图(Line Plots)
- 4. 直方图(Histograms)
- 5. 盒图(Box Plots)
1. 饼图(Pie Charts)
饼图可以用来显示比例情况.
image.png如果我们有一个完整数据集,例如棒球联盟中的所有球员以及位置列表,饼图可以告诉我们每个位置在总体中所占的百分比,可以想象成将一块饼切成几片,每片都对应了在整个列表中的百分比
在电子表格中很简单,因为我们只需一个类别列表,以及对应的值 例如和或数量
image.png- 选择类别和值列表
- 转到
insert
插入菜单并选择饼图
进一步优化
image.png选择图表后, Excel 功能栏中出现了设计和格式菜单,设计菜单给出了很多选择,可以通过编辑图表标题 改成更有意义的标题,还可以有更多操作 例如更改图表外观
也可以使用之前仔细选择的数据透视表,就是这个数据透视表
image.png顶部的行是位置类别 总计位于底部的行上,选择类别 然后按Windows 上的 Ctrl 键,或者 Apple 键盘上的 Command 键 用鼠标选择底部的行,最可靠的是将这些内容,复制粘贴到别的位置,粘贴时我将使用转置功能,获得这些列
image.png然后像之前选择并插入饼图,得出完全一样的结果
image.png
2. 条形图(Bar Charts)
我们可以使用和之前一样的信息,并选择条形图或柱状图 而不是饼图,它将只显示值而不是百分比,并用更长的长条和柱条表示更大的值.
image.png在此图表中,我们将类别值相互对比并看到相对大小,但是 我们不能像之前的饼图那样,知道整个联盟或每个类别的百分比
选择使用哪种图表取决于,你想突出显示哪种规律并回答什么问题,使用条形图或柱状图可以对比类别值,这些类别可以是这里显示的球员位置,或销售年份或苹果和橘子,饼图用来显示类别比例
image.png
3. 散点图(Scatter Plots)和线图(Line Plots)
我们使用饼图和柱状图来可视化分类数据,如果我们拥有值数据列表,例如一段时间内的股价列表,那么折线图可以更好地展示数据集
image.png这是我从金融网站上下载的数据表格,即 AAPL 股票的市价,它有日期 开盘价,最高价、最低价、收盘价和成交量列
image.png我想选择日期列和收盘价列,然后转到插入菜单并选择折线图,我可以将图表单独放入一个工作表中 这样更容易看清细节部分
image.png这个图表比较普通,可以在图表设计菜单中快速改进一下,我将选择一个 并将标题改为 AAPL Stock Price,横轴显示的是日期,纵轴显示的是美元值
image.png现在可以快速看出,在过去一年内 股价一直在上涨 只是上个月波动了下
如果同一日期有多列数据,我可以在同一图表上为每列显示一条直线,我将使用相同的数据集,但是我将选择 AAPL Stock 的最高价和最低价,因为最高价和最低价相差并不大,我将左侧的美元值范围改为从 100 开始,选择纵轴,右击并设定坐标轴格式,
image.png image.png现在可以看到最高价和最低价折线 并可以看到二者之间的差别
image.png有很多更改折线图外观的方法 可以修改布局,我还可以不使用日期 绘制出 AAPL 股票的两个不同变量,例如收盘价和成交量,当我选择散点图时,形成的图表是收盘价位于横轴上,当天的成交量位于纵轴上,可以看出价格似乎都聚集在几个区域,基本上成交量一样 虽然在一些较低价时对应高成交量
image.png
4. 直方图(Histograms)
直方图是一种柱状图 衡量的是数据在数据集中出现的频率,具而言 将值组合为我们定义的 bin (箱),之前 我们创建了一个柱状图,用于比较数据集中的类别数量,这种图表可以回答类似于,“大联盟中每个位置有多少名球员?”这样的问题,但是如果我们想知道,有多少球员的薪资不到 100 万美元,在 100 万到 200 万美元之间,在 200 万美元到 300 万美元之间 等等 该怎么办?,这种图表就是直方图
image.png在 Excel 中可以用两种方式绘制该图表
image.png工具包直方图需要两列数据,一个是要分析的数据列,一个是表示 bin 之间的组距,在此示例中 我从 100 万美元开始,然后是 200 万美元 等等,一直到 1500 万美元
image.png- 当我创建直方图时,薪资列表中低于 100 万美元的值数量,将位于第一个 bin 中,在 100 万到 200 万之间的薪资数量位于第二个 bin 中 以此类推,要创建该直方图,在 Windows 上从
Data
数据菜单中选择Data Analysis
数据分析 或者在 Mac 上从工具菜单中进行选择,选择直方图
- 随即打开一个对话框,在输入区域,选择薪资列中的数据,在接收区域 (Bin range),选择你所创建的组距
- 如果列的顶部有标题 就像我的这样 勾选“标志” (
labels
) 项,在输出选项中,选择New Worksheet ply
新工作表以及Chart Output
图表输出,点击确定,Excel 将分析列表并在新的工作表上创建对 bin 的计数,然后创建一个与之匹配的柱状图
第二种方法仅适用于 Excel 2016 (Windows 版),选择你的数据并点击“插入”,“推荐的图表” 然后选择直方图,要配置 bin 的细节
,右击图表的横轴,点击设置坐标轴格式 然后点击坐标轴选项,该对话框提供了选择分类数据的选项,例如球员位置 以及针对值数据的“自动”选项,你可以指定你想要研究的箱数 (Number of bins)
,如果选择的 bin 太窄,结果可能噪声太多,另一方面 如果 bin 太少 就隐藏了一些细节,和往常一样 思考下你要了解和传达关于数据的什么信息,并据此作出这些判断,和其他表格一样,选择图表后 可以在设计菜单中,进一步自定义设计和布局
5. 盒图(Box Plots)
箱线图 (Box Plot) 也称箱须图 (Box-whisker Plot),是对数据集的离散程度进行可视化
传统箱线图使用五数概括法进行绘制,五数概括法包括五个值, 最大值、最小值、第 1 四分位数, 第 2 四分位数 也称中位数, 以及第 3 四分位数
image.png- 最大值成为上部胡须的顶点
- 最小值成为下部胡须的最低点
- 方框代表数据的中间部分 其中一条直线是中位数所在位置
并放置表示均值 即数据集平均值的 X
创建箱线图
- 选择数据列
- 点击“插入”、“推荐的图表” 然后点击“箱形图” (即箱线图)
注意 箱线图表示的是单个数字列表的统计信息
因此你所选的每个列表都用单独的箱线图表示
箱线图现在给出了值列表离散程度的直观感受
image.png