python源码大全码农的世界

Python 操作PDF库介绍之PDFMiner

2019-02-24  本文已影响5人  iCloudEnd

Python 操作PDF库介绍之PDFMiner

介绍

PDFMiner是一种从PDF文档中提取信息的工具。与其他PDF相关工具不同,它完全专注于获取和分析文本数据。
PDFMiner允许人们获取页面中文本的确切位置,以及字体或线条等其他信息。
它包括一个PDF转换器,可以将PDF文件转换为其他文本格式(如HTML)。它具有可扩展的PDF解析器,可用于除文本分析之外的其他目的。

特点

安装

github:
https://github.com/euske/pdfminer/

使用

pdf2txt.py samples/simple1.pdf
pyd2txt
上一篇下一篇

猜你喜欢

热点阅读