记录安装Python第三方包“tesserocr”的方法和遇到的坑
1. 环境:
系统环境:win7 32 位系统
python版本: 3.6.5 虚拟环境为:miniconda3
2. 共需要安装的模块:
a. tesserocr
b. tesseract
c. pil
3. 安装方法:
我的安装顺序为:b -> a -> c
其实安装最为麻烦,报错最多的模块是tesserocr,我尝试了以下这些命令:
pip install tesserocr
pip3 install tesserocr
conda install tesserocr
conda install -c simonflueckiger tesserocr
前三个根本就是不行
最后一个确实是能找到tesserocr的资源,但是根本就下不动,我估计要是挂代理下载的话也许能行,有条件的可以试试。
最后我的解决办是参照了这篇博客: 中所讲的方法,在网上下载了 tesserocr-2.4.0-cp36-cp36m-win32.whl 这个.whl文件来安装,很好,安装的很顺利。其中需要注意的是,当你执行:pip install tesserocr-2.4.0-cp36-cp36m-win32.whl 这条命令的时候,如果你没把你下载下来的.whl文件放在正确的文件目录下的话,这条语句会报错,提示你:tesserocr-2.4.0-cp36-cp36m-win32.whl似乎是一个文件名,但是在巴拉巴拉目录下没有该文件(当然人家是英文报错,我给你翻译了),那就好办了,那就根据它的提示把该.whl文件放在它提示的文件目录下就好了。
然后再说一下 关于 tesserocr 和 tesseract 版本匹配的问题,一开始我并不了解该怎么装这些东西,所以在下载tesseract的时候(下载地址也参考我前文提到的博客)我就下载了最新的tesseract版本(tesseract-ocr-w32-setup-v5.0.0-alpha.20191030),心想肯定是最新的版本最厉害嘛,然后发现网上好多人说tesserocr的版本要和tesseract的版本匹配,如下图:
但是我在安装 tesseract-ocr-w32-setup-v5.0.0-alpha.20191030 时真的是用了很长时间,这个的安装方法也参考我前文提到的博客。我是真的不想再去卸载掉然后下载个tesserocr v2.4.0版再浪费好几个小时安装一遍,所以我就抱着尝试的心态,尝试了一下,我发现
测试代码:
1 import tesserocr 2 from pil import image 3 4 image = image.open('image.png') 5 print(tesserocr.image_to_text(image))
运行结果:
没想到它竟然能运行成功!!!
这两个版本据说不符的家伙竟然被我给撮合到一起了???
那行吧,反正不报错最好啦~
最后再说一下关于 安装 pillow 遇到的报错。
就是在anaconda promote中执行这条语句时:pip install pillow 报错了:could not find a version that satisfies the requirement pil (from versions: ) no matching distribution found for pil。
这个的解决方案参考这篇博客:【python】could not find a version that satisfies the requirement pil (from versions: ) no matching distribution found for pil 按照他的解决方案解决即可。
最后的最后,出了文中提到的几篇博客之外,我觉得还有几篇讲得不错的博客推荐给大家,安装方法就不用过多关注了,按照我的方法来你们肯定能把环境搭起来了,这几篇博客就供大家取材用吧。
2.
3.
上一篇: Python中property属性的概论和使用方法
下一篇: Python简单爬虫