python爬虫一些必要的库

2019-11-21  本文已影响0人  bclz
推荐使用编译好了的whl文件安装(避免需要c++环境,各种报错)
whl下载地址:https://github.com/simonflueckiger/tesserocr-windows_build/releases

tesserocr GitHub: https://github.com/sirfz/tesserocr
tesserocr PyPI: https://pypi.python.org/pypi/tesserocr
tesseract 下载地址:http://digi.bib.uni-mannheim.de/tesseract
tesseract GitHub : https://github.com/tesseract-ocr/tesseract
tesseract 语言包 : https://github.com/tesseract-ocr/tessdata
tesseract 文档 : https://github.com/tesseract-ocr/tesseract/wiki/Documentation
python3.7还有一些坑(3.5后,async/await变成关键字了):
修改下列python文件中的async为async1(全部替换)
run.py
fetcher\tornado_fetcher.py
webui\app.py

还需要 python -m pip install wsgidav==2.4.1
  1. Scrapy (pip install Scrapy)
上一篇 下一篇

猜你喜欢

热点阅读