Mac上安装Tesseract-Ocr并测试

2019-07-18  本文已影响0人  湖心亭不看雪

先装home-brew,这是一段辛酸的历程

心塞塞

安装依赖库brew install leptonica

装依赖库

然后按照教程brew install --with-training-tools tesseract

报错!

显示不存在选项

网上查了一下,发现是homebrew不支持,它里面没有“-with-training-tools”的选项了

(插一句嘴,装homebrew和tesseract-ocr的时候有条件的话还是开个VPN)

抱着碰运气的心态打了 brew install tesseract

出现了error

不管那个error,试着打了tesseract --version

看到了版本

然后进行测试

先从网上截了张图

从网上截的图

在终端输入 tesseract -l chi_sim saomiao.png result

其中“chi_sim”指的是用中文输入(需要下载,下载地址:https://github.com/tesseract-ocr/tessdata  ;简体中文库为:chi_sim.traineddata  ,下载后拖入 /usr/local/share/tessdata文件夹内)

“saomiao.png”是我给截图取的名字,这里需要填的是图片的路径,写的时候记得修改

终端输入

然后桌面上出现了结果文件

txt

打开它

文件内容

测试成功,但从结果可以看出有些复杂的字是有点难以识别的,比如图中“濬”字变没有识别出来

上一篇 下一篇

猜你喜欢

热点阅读