Python实现OCR文字识别

2021-12-26  本文已影响0人  Armlinux

Python实现文字识别

1.pip install pytesseract

2.从https://digi.bib.uni-mannheim.de/tesseract/下载

| tesseract-ocr-w64-setup-v5.0.0.20211201.exe |

https://esseract-ocr.github.io/tessdoc/Data-Files.html下载语言数据文件| chi_sim.traineddata |

3.python源码

from PIL import Image 
import pytesseract
def imageToStr(image_url, lang): 
    im = Image.open(image_url) 
    im = im.convert('L')
    im_str = pytesseract.image_to_string(im, lang=lang) 
    return im_str
# 
img_str = imageToStr('01.png','eng') 
print('识别到的英文',img_str)

print('识别到的中文')
cn_img_str = imageToStr('02.png','chi_sim_vert') 
print(cn_img_str)
上一篇 下一篇

猜你喜欢

热点阅读