欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

记录安装Python第三方包“tesserocr”的方法和遇到的坑

程序员文章站 2022-05-29 08:12:59
1. 环境: 系统环境:Win7 32 位系统 Python版本: 3.6.5 虚拟环境为:Miniconda3 2. 共需要安装的模块: a. tesserocr b. tesseract c. PIL 3. 安装方法: 我的安装顺序为:b -> a -> c 其实安装最为麻烦,报错最多的模块是t ......

1. 环境:

系统环境:win7 32 位系统

python版本: 3.6.5        虚拟环境为:miniconda3

2. 共需要安装的模块:

a. tesserocr 

b. tesseract

c. pil

3. 安装方法:

我的安装顺序为:b -> a -> c

其实安装最为麻烦,报错最多的模块是tesserocr,我尝试了以下这些命令:

pip install tesserocr

pip3 install tesserocr

conda install tesserocr

conda install -c simonflueckiger tesserocr

前三个根本就是不行

最后一个确实是能找到tesserocr的资源,但是根本就下不动,我估计要是挂代理下载的话也许能行,有条件的可以试试。

最后我的解决办是参照了这篇博客: 中所讲的方法,在网上下载了 tesserocr-2.4.0-cp36-cp36m-win32.whl 这个.whl文件来安装,很好,安装的很顺利。其中需要注意的是当你执行pip install tesserocr-2.4.0-cp36-cp36m-win32.whl 这条命令的时候,如果你没把你下载下来的.whl文件放在正确的文件目录下的话,这条语句会报错,提示你:tesserocr-2.4.0-cp36-cp36m-win32.whl似乎是一个文件名,但是在巴拉巴拉目录下没有该文件(当然人家是英文报错,我给你翻译了),那就好办了,那就根据它的提示把该.whl文件放在它提示的文件目录下就好了。

然后再说一下 关于 tesserocr 和 tesseract 版本匹配的问题一开始我并不了解该怎么装这些东西,所以在下载tesseract的时候(下载地址也参考我前文提到的博客)我就下载了最新的tesseract版本(tesseract-ocr-w32-setup-v5.0.0-alpha.20191030),心想肯定是最新的版本最厉害嘛,然后发现网上好多人说tesserocr的版本要和tesseract的版本匹配,如下图:记录安装Python第三方包“tesserocr”的方法和遇到的坑

 

但是我在安装 tesseract-ocr-w32-setup-v5.0.0-alpha.20191030 时真的是用了很长时间,这个的安装方法也参考我前文提到的博客。我是真的不想再去卸载掉然后下载个tesserocr v2.4.0版再浪费好几个小时安装一遍,所以我就抱着尝试的心态,尝试了一下,我发现

测试代码:

1 import tesserocr
2 from pil import image
3 
4 image = image.open('image.png')
5 print(tesserocr.image_to_text(image))

运行结果:

记录安装Python第三方包“tesserocr”的方法和遇到的坑

 

没想到它竟然能运行成功!!!

这两个版本据说不符的家伙竟然被我给撮合到一起了???

记录安装Python第三方包“tesserocr”的方法和遇到的坑

 

那行吧,反正不报错最好啦~

最后再说一下关于 安装 pillow 遇到的报错

就是在anaconda promote中执行这条语句时:pip install pillow 报错了:could not find a version that satisfies the requirement pil (from versions: ) no matching distribution found for pil。

这个的解决方案参考这篇博客:【python】could not find a version that satisfies the requirement pil (from versions: ) no matching distribution found for pil 按照他的解决方案解决即可。

 

最后的最后,出了文中提到的几篇博客之外,我觉得还有几篇讲得不错的博客推荐给大家,安装方法就不用过多关注了,按照我的方法来你们肯定能把环境搭起来了,这几篇博客就供大家取材用吧。

1. python tesserocr模块使用示例

2. 

3.