tesserocr下载安装

2021-08-17  本文已影响0人  斐硕人

安装 Tesseract 4.0.0

  1. 下载地址
    Index of /tesseract (uni-mannheim.de)

  2. 安装 tesseract-ocr-w64-setup-v4.0.0.20181030.exe

  3. 配置环境变量

  4. 将 tessdata 文件夹复制至 Python/Anaconda 安装目录中

  5. 测试是否安装成功

# cmd 输出版本号
tesseract -v
  1. 使用tesseract
    • cmd进入图片目录
    • 输入命令行 tesseract <picture_file> <output_file_name> -l chi_sim
    • 目录下找到输出文件 result.txt

-l chi_sim 表示用简体中文字库(需要下载中文字库文件,解压后,存放到tessdata目录下去,字库文件扩展名为 .raineddata 简体中文字库文件名为: chi_sim.traineddata)

使用tesseract
  1. 踩坑
    ERROR: tesserocr-2.4.0-cp37-cp37m-win_amd64 (1).whl is not a supported wheel on this platform.
    python -m pip install --upgrade pip

安装 Tesserocr

  1. pip3 install pillow
  2. 下载安装与Tesseract 版本对应的 Tesserocr文件地址 (github.com)
  3. pip install tesserocr-2.4.0-cp37-cp37m-win_amd54.whl
    install tesserocr
  4. 测试
# cmd python环境导入包tesserocr
>> python

>> import tesserocr
使用 tesserocr
  1. 踩坑
    报错没有Microsoft C++ Build Tools

参考文章:

  1. pip3 install tesserocr安装失败(已解决)_zoujin6649的博客-CSDN博客_tesserocr安装失败
  2. Tesseract-OCR 安装、中文识别与训练字库_氦叁的博客-CSDN博客
  3. Tesserocr库安装与使用 - 知乎 (zhihu.com)
  4. ImportError: cannot import name 'InvalidSchemeCombination' from 'pip._internal.exceptions'报错解决 - 嘉禾旧木 - 博客园 (cnblogs.com)
  5. Release tesserocr v2.4.0 (tesseract 4.0.0) · simonflueckiger/tesserocr-windows_build (github.com)
  6. tesserocr:第三方模块tesserocr安装 - 云+社区 - 腾讯云 (tencent.com)
上一篇下一篇

猜你喜欢

热点阅读