自控力school同学会(无输出,白读书)

9/70 PDF内容获取

2017-04-06  本文已影响57人  noparkinghere

layout: "post"
title: "PDF内容获取"
date: "2017-03-08 21:00"


其实 PDF 转 word 已经不算是什么新兴技术了,大约 10 年左右的时候,我在网上通过一些本地转换工具/在线转换工具,以及汉王OCR等软件,就已经可以把 PDF 导成 word 或者获取 PDF 文件中的绝大多数内容了。而随着软件技术的不断发展,最近的一些新兴软件在转换效率等上面也做的越来越出色,目前大多数的 PDF 文档几乎都可以完美转换成 word 格式。

在正文之前,首先安利一个 PDF 软件,国内出名的算是福昕阅读器了,该软件的特点就是速度快,占用资源少,功能多(虽然他也有很多缺点,但和同类 PDF 软件比已经可以甩开别人好几条街了)。这边就 PDF 中的内容获取,我们可以分为三类,以下针对他们也会一一详细介绍。

复制粘贴

并不是每个人都需要获取 PDF 文件中全部内容的,很多时候我们在阅读一个 PDF 文档时,也许只是需要摘录他的一句话,或者获取一小段文字。这个时候往往可以在 PDF 中直接选中这段文字,右击或使用快捷键复制。但往往有些人会特意为难我们,他们会在自己的 PDF 文件上面进行加密,让你只能阅读文件,却没法对文件内容进行任何复制,标注等操作。如果遇到这种问题,可以使用我这边提供的一个小工具,pdfunlocker,如果无法解密,可以去找新版的软件。。

这边介绍两个比较好用的 PDF 小工具:FreePic2Pdf+PdgCntEditor。解锁后的文件很多会丢失目录,可以通过软件 PdgCntEditor 获取文档目录编辑。同时 FreePic2Pdf 软件(批量将图片导出成 PDF 文档)可以和 PdgCntEditor 一起使用,

文字转成 word

虽然计算机发展了很多年,但仍然有不少人会使用 word 来进行排版和编辑。他们也希望所有获得的文档都是 word 类格式(包括 .doc .docx等等)的,这样他们就可以对文档中的内容进行任意的增删改查了,虽然说 PDF 出现就是为了规范格式,让一般人无法轻易的对其中的内容做修改,但仍然有很多人乐此不疲的想这么做。PDF 转 word 的软件可以说是相当繁多且良莠不齐,这边我们只推荐一款: PDF-to-Word 该软件网上很容易找到,这边就不给出链接了,当然其他还有很多可以将 PDF 转成 word 的工具,如在线网站 smallpdfnitropdf等等。

图片转 word

并不是所有的 PDF 都可以轻易转成 word,以上那类 PDF 转 word 的软件,很多都只适用于文字的转换,换言之,就是本来文字内容你就是可以选择的,软件要做的只是讲文字内容自动复制出来,进行重新排版,然后生成 word 文件给你看。但现在很多 PDF 文件的内容都不是文字格式的,很多内容是扫描件,或者是手工拍的照片,更有胜者将文字转成了图片在导入到 PDF 中。这些无疑都增加了你导出内容的难度,然而,这些问题也只能难道过去你的,对 OCR 技术如此成熟的今天,只要不是手写内容,基本上都可以 100% 的识别出来。下面我们介绍下几款这种软件:

小结

以上这些软件都是一看就会用的软件,这边不再具体给出软件的教程,如有疑问可以自己多尝试,或者直接网络搜索。


写作时间:21:00-22:08

上一篇 下一篇

猜你喜欢

热点阅读