【UiPath Studio 中文文档】58 数据抓取 - 数据
为了更好地理解如何利用数据抓取功能,让我们创建一个从 Amazon 提取一些特定信息的自动化程序。
注意:
建议您在 InternetExplorer 11 及以上、MozillaFirefox 50 或更高版本或最新版本的 Google Chrome 上运行 Web 自动化。
假设您是一家体育用品供应商,您有兴趣在网上了解排球的最新价格。您可以这样做:
-
打开 IE 浏览器,导航到 www.amazon.com。
-
在搜索框中,键入volleyball ball 并按 Enter.将结果显示在网页中。
-
在 Studio 中,在 Design 选项卡上的 Wizards 按钮组,单击 Data Scraping,将显示 Extract Wizard 。
![](https://img.haomeiwen.com/i3353491/dc5722d5bf3b1eb8.png)
4.在向导之后,选择网页中的第一项和最后一项。显示 Configure Columns 向导步骤。
5.选中 Extract URL 复选框。
6.更改列标题的名称。
7.单击 Next,将显示数据的预览,您选择的字段将在Web浏览器中突出显示。
![](https://img.haomeiwen.com/i3353491/ccb76655dda73246.png)
-
点击 Extract Correlated Data 按钮,再次显示 Extract Wizard 窗口
-
在向导之后再次指出项目的价格。您将进入 Configure Columns 步骤。
-
更改新列的名称,然后单击 Next, 显示数据预览。
![](https://img.haomeiwen.com/i3353491/c3f56974122fa1e8.png)
-
(可选)通过拖动列的位置来改变列的顺序。
-
单击 Finish,将显示 Indicate Next Link 窗口,提示您在跨越多个页面时指示 Next 按钮。
-
单击 Yes 并在 amazon 中选择 Next Page 按钮。该项目保存并显示在 Designer 面板中。注意,数据表变量 ExtractDataTable 已经自动生成。
-
拖一个 Excel Application Scope 活动到 Data Scraping 容器中。
注意:
使用 Manage Packager 安装 Excel 活动包才可以访问这些活动。
-
在 Properties 面板的 WorkbookPath 字段中,键入要将数据写入的现有 Excel 文件的文件路径。
-
在 Variables 面板中,将自动生成的数据表变量的范围更改为 Sequence。
-
拖拽一个 Write Range 活动到 Excel Application Scope 内部。
-
在 Properties 面板中的 DataTable 字段添加变量名 ExtractDataTable 。项目最终如下图所示:
![](https://img.haomeiwen.com/i3353491/7665c189637af76d.png)
-
点击 F5 运行
-
打开在 步骤 15 设定的 Excel 文件。注意,所有列都已正确填充。
![](https://img.haomeiwen.com/i3353491/b727e79273cbb71d.png)
更多 UiPath 相关的资讯,请关注公众号:UiPath教程
由于简书禁止直接在文章中插入公众号二维码,请点击 这里 了解添加该公众号的细节。