pytesseract、PIL的使用与python实现简单的图像
2018-07-20 本文已影响0人
笨笨的简书
1、背景
比如我们看到如下的一张图片:
I have a dream的节选我们想提取这个图片中的问题,用于复制粘贴或者其它等用途,有没有办法直接识别?当然有啦,比如很多程序都支持这个功能:微信、有道笔记等。那python是否有包支持这个功能呢?今天就来学习和实践如何用python的pytesseract和PIL实现图片中的文本识别。
2、步骤
2.1、需要安装的包
pip install pytesseract
pip install PIL
2.2、程序的demo如下
图像文字识别但执行的时候可能报错:
报错通过查问题发现:python的pytesseract包会从系统的环境指令中查找tesseract指令;因此,需要在系统中安装这个程序;
mac安装方法:brew install tesseract,其它平台查询以下就好,很简单。
之后再执行以下就没问题啦:
Five score years ago, a great American, in whose symbolic
shadow we stand today, signed the Emancipation
Proclamation. This momentous decree came as a great
beacon light of hope to millions of Negro slaves who had been
seared in the flames of withering injustice. It came as a joyous
daybreak to end the long night of bad captivity.