大数据,机器学习,人工智能小白修炼营之RPARPA

UiPath基础篇 - PDF自动化

2020-03-06  本文已影响0人  哈皮小白

今天要和大家分享的是UiPath关于PDF相关的自动化内容。

区别于Excel和数据表的自动化,PDF相关的自动化操作主要聚焦如何抓取PDF文件中的内容。

首先我们要做的是安装PDF activity包,因为初始安装的Studio默认是不带PDF的activity包的。

安装的方法很简单,在菜单栏找到Manage Pacakges按钮点击进入activity包管理界面。

搜索PDF并点击Install直接安装如下官方版本package即可。

提取PDF文档内容的方法有两种:Read PDF TextRead PDF With OCR。两种方法都可以在后台运行。

两者的区别是:Read PDF Text适用于识别PDF中的印刷体文字信息,而Read PDF With OCR则可用于识别手写或扫描的文字。

Read PDF Text举例。我们需要相关PDF文档的路径来定位文件。

另外,属性设置中的Range用来指定读取的页数。例如:"All", "3-7", ”1”。Output中的Text是输出的字符串。

除了Read PDF,我们还可以通过Anchor Base activity来批量抓取相似格式的PDF上的指定数据。

Anchor Base的左边放置Find Element activity来确定需要抓取的对象的位置,右边放置Get Text activity来读取相关数据。

这种方法可常用于读取发票等PDF文件上的特定信息,大家可以亲自试验一下。

同学们有任何问题或建议都可以通过以下二维码或搜索微信公众号小白修炼营之RPA UiPath找到我们。当然你也可以直接加入我们小白修炼营的QQ群,和小伙伴们随时随地一起聊RPA。

上一篇下一篇

猜你喜欢

热点阅读