Mac上安装Tesseract-Ocr并测试
2019-07-18 本文已影响0人
湖心亭不看雪
先装home-brew,这是一段辛酸的历程

安装依赖库brew install leptonica

然后按照教程brew install --with-training-tools tesseract
报错!

网上查了一下,发现是homebrew不支持,它里面没有“-with-training-tools”的选项了
(插一句嘴,装homebrew和tesseract-ocr的时候有条件的话还是开个VPN)
抱着碰运气的心态打了 brew install tesseract

不管那个error,试着打了tesseract --version

然后进行测试
先从网上截了张图

在终端输入 tesseract -l chi_sim saomiao.png result
其中“chi_sim”指的是用中文输入(需要下载,下载地址:https://github.com/tesseract-ocr/tessdata ;简体中文库为:chi_sim.traineddata ,下载后拖入 /usr/local/share/tessdata文件夹内)
“saomiao.png”是我给截图取的名字,这里需要填的是图片的路径,写的时候记得修改

然后桌面上出现了结果文件

打开它

测试成功,但从结果可以看出有些复杂的字是有点难以识别的,比如图中“濬”字变没有识别出来