使用pytesseract库进行图像识别

2020-07-28  本文已影响0人  炫子_260f

参考:

python 技术篇-使用pytesseract库进行图像识别之环境配置
按照这篇文章,配置好
python 使用tesseract进行图片识别
Python验证码识别 安装Pillow、tesseract-ocr与pytesseract模块的安装以及错误解决
Python-tesseract识别图片文字

环境变量配置

1.添加环境变量 TESSDATA_PREFIX -> D:\Tesseract-OCR\tessdata
注:末尾不要加;
2.环境变量path后面追加 D:\Tesseract-OCR;

异常处理

  1. traineddata 缺少
    Error opening data file F:\Tesseract-OCR\eng.traineddata 解决办法及各种*.traineddata缺少
    原因:缺少训练好的数据
    解决方法:网上下载训练好的数据即可,但要先保证TESSDATA_PREFIX环境变量配置好
    下载训练数据地址:
    https://tesseract-ocr.github.io/tessdoc/Data-Files
    我使用中文lang='chi_sim',就下载:
    image.png

windows平台下载安装exe:
https://github.com/UB-Mannheim/tesseract/wiki

上一篇下一篇

猜你喜欢

热点阅读