导入数据至Excel并建立数据模型
从数据库导入数据
这次 目标是连接到外部数据源,并将数据导入 Excel 中供进一步分析。
首先,下载老师已经给定的数据。 这些数据描述奥运会奖牌情况,是一个 Microsoft Access 数据库。
在 Excel 中,打开一个空白工作簿。
单击“数据”>“获取外部数据”>“自 Access”。 功能区会基于工作簿的宽度动态调整,因此功能区上的命令可能看起来与下面的屏幕稍有不同。 第一个屏幕显示工作簿很宽时的功能区,第二个图像显示调整工作簿大小后工作簿界面仅占屏幕一部分时的情形。
选择下载的 OlympicMedals.accdb 文件,然后单击“打开”。 将出现下面的“选择表格”窗口,其中显示在数据库中找到的表格。 数据库中的表格类似于 Excel 中的工作表或表。 选中“支持选择多个表”框,选择所有表格。 然后单击“确定”。
将显示“导入数据”窗口。 注意该窗口底部的复选框,选中该框可以“将此数据添加到数据模型”,如下面的屏幕中所示。 数据模型是在同时导入或使用两个或更多个表时自动创建的。 数据模型可集成表,支持使用数据透视表、Power Pivot 和 Power View 进行全面分析。 从数据库导入表格时,将使用这些表格之间的现有关系在 Excel 中创建数据模型。 数据模型在 Excel 中是透明的,但可以使用 Power Pivot 加载项直接查看和修改数据模型。
选择“数据透视表”选项(这会将表格导入 Excel 中并准备数据透视表以便分析导入的表格),然后单击“确定”。
将数据导入到 Excel 且自动创建数据模型后,即可浏览数据。
使用数据透视表浏览数据
使用数据透视表浏览导入的数据非常容易。 在数据透视表中,可将表(与刚从 Access 数据库导入的表相似)中的字段(与 Excel 中的列相似)拖动到数据透视表中的其他区域,以调整数据的显示方式。 数据透视表具有四个区域:“筛选”、“列”、“行”和“数值”。
可能需要做些尝试才能确定应将字段拖动到哪个区域。 根据需要拖动表中任意数量的字段,直到数据透视表按自己需要的方式显示数据。 再通过将字段拖动到数据透视表的不同区域进行随意浏览;当排列数据透视表中的字段时,基础数据不会受到影响。
现在我们在数据透视表中浏览奥运会奖牌数据,从按比赛项目、奖牌类型和运动员所属国家/地区组织的奥运会奖牌获得者开始。
在“数据透视表字段”中,通过单击“奖牌”表旁边的箭头展开它。 在展开的“奖牌”表中找到 NOC_CountryRegion 字段,将其拖动到“列”区域。 NOC 表示国家奥委会,是国家或地区的组织单位。
接下来,从“分项”表中将“分项”拖动到“行”区域。
我们对“分项”进行筛选,以仅显示五项运动:射箭、跳水、击剑、花样滑冰和速度滑冰。 可以从“数据透视表字段”区域内或从数据透视表本身中的“行标签”筛选器执行此筛选。
单击数据透视表中的任意位置,以确保选定了 Excel 数据透视表。 在“数据透视表字段”列表中(其中“分项”表展开),将鼠标指针悬停在“分项”字段上,字段右侧将显示下拉箭头。 单击下拉列表,单击“(全选)”删除所有选择,然后向下滚动并选择射箭、跳水、击剑、花样滑冰和速度滑冰。 单击“确定”。
或者,在数据透视表的“行标签”部分中,单击数据透视表中“行标签”旁边的下拉列表,单击“(全选)”删除所有选择,然后向下滚动并选择射箭、跳水、击剑、花样滑冰和速度滑冰。 单击“确定”。
在“数据透视表字段”中,从“奖牌”表中将“奖牌”拖动到“值”区域。 由于“值”必须为数字,因而 Excel 会自动将“奖牌”更改为“奖牌数”。
从“奖牌”表中再次选择“奖牌”并将其拖到“筛选”区域。
我们对数据透视表进行筛选,以仅显示奖牌总数超过 90 枚的那些国家或地区。 下面介绍如何操作。
在数据透视表中,单击“列标签”右侧的下拉列表。
选择“值筛选器”,然后选择“大于…”
在最后一个字段中(位于右侧)键入90。单击“确定”。
数据透视表类似于下面的屏幕。
由于表之间已经预先存在关系,因而执行此任务非常简单。由于表关系已存在于源数据库中,并且在一项操作中导入了所有表格,所以 Excel 可以在其数据模型中重新创建这些表关系。
但是,如果数据来自不同源或者是以后导入的,该怎么办,通常,可以基于匹配列使用新数据创建关系。在下一步骤中,将导入其他表,并了解如何创建新关系。
从电子表格导入数据
现在我们从另一个源中导入数据,这次是从现有工作簿中导入,然后指定现有数据和新数据之间的关系。 关系是能够分析 Excel 中的数据集合,利用导入的数据创建有趣的沉浸式可视化效果。
我们首先创建一个空白工作表,然后从 Excel 工作簿中导入数据。
插入新的 Excel 工作表,将其命名为运动。
通过浏览找到包含下载的示例数据文件的文件夹,打开OlympicSports.xlsx。
在Sheet1中选择并复制数据。 如果选择了一个包含数据的单元格,如单元格 A1,就可以按 Ctrl + A 选择所有相邻数据。 关闭 OlympicSports.xlsx 工作簿。
在“运动”工作表中,将光标放在单元格 A1 中并粘贴数据。
为该表命名。 在“表格工具 > 设计 >属性”下,找到“表名称”字段并键入“运动”。 工作簿类如以下屏幕所示。
保存工作簿。
使用复制和粘贴导入数据
现在我们已从 Excel 工作簿中导入了数据,下面我们从在网页中找到的表导入数据,或者从任何其他源中将数据复制和粘贴到 Excel 中。 在以下步骤中,可以从一个表中添加奥运会举办城市。
插入新的 Excel 工作表,将其命名为“举办地”。
选择并复制下表(包括表标题在内)。
1、在 Excel 中,将光标放在“举办地”工作表的单元格 A1 中并粘贴数据。
2、将数据格式化为表。按 Ctrl + T 将数据格式化为表,或从“开始 > 套用表格格式”执行此操作。 由于数据包含标题,因而可在显示的“创建表”窗口中选择“表包含标题”。
3、为该表命名。 在“表格工具 > 设计 >属性”下,找到“表名称”字段并键入“举办地”。
4、选择“版本”列,并从“开始”选项卡中将其格式设置为带 0 位小数的“数字”。
5、保存工作簿。 工作簿如以下屏幕所示。
现在Excel 工作簿中已经有了多个表,从而可以创建它们之间的关系。 通过创建表之间的关系,也可以组合来自两个表中的数据。