Python实现识别图片内容的方法分析

程序员文章站 2023-09-04 10:51:19

本文实例讲述了Python实现识别图片内容的方法。分享给大家供大家参考，具体如下： python识别图片内容。这里我的环境为windows64位，python2.7....

本文实例讲述了Python实现识别图片内容的方法。分享给大家供大家参考，具体如下：

python识别图片内容。

这里我的环境为windows64位，python2.7.14

需要用到PIL模块和tesseract模块。

首先需要安装pip包管理，安装方法可参考附录

安装PIL模块：

pip install Pillow

tesseract模块安装：

pip install pytesseract

安装识别引擎和中文语言包，点击此处。

下载完成解压：

1.双击tesseract-ocr-setup-3.02.02.exe安装，安装完成后，需要指定tesseract模块识别引擎的程序路径，打开python安装路径的模块路径，我的路径为：E:\wamp\python\Lib\site-packages\，进入pytesseract，编辑pytesseract.py文件，修改 tesseract_cmd = 'tesseract' 的内容：

# tesseract_cmd = 'tesseract' # 修改为安装Tesseract-OCR的真实路径
tesseract_cmd = 'E:/wamp/python modules/Tesseract-OCR/tesseract.exe'

2.进入解压包中的中文语言包，复制chi_sim.traineddata到Tesseract-OCR安装目录下tessdata文件夹下，我的路径：E:\wamp\python modules\Tesseract-OCR\tessdata\chi_sim.traineddata

环境配置完成。

python代码：

# -*- coding: UTF-8 -*-
from PIL import Image
import pytesseract
# 识别中文
text = pytesseract.image_to_string(Image.open('chinese.png'),lang='chi_sim')
print text
# 识别英文
text = pytesseract.image_to_string(Image.open('english.png'))
print text

附：windows下安装python包管理器pip

windows下安装python包管理器pip。

pip下载地址：

选择 pip-9.0.1.tar.gz (md5, pgp)

下载完成解压，这里我解压到D:\python\pip-9.0.1，命令行进入D:\python\pip-9.0.1

cd D:\python\pip-9.0.1

安装pip

python setup.py install

安装完成，输入pip list查看是否成功

pip list

显示下面信息代表安装成功：

pip (9.0.1)
setuptools (28.8.0)

pip安装模块命令：

pip install xxx

更多关于Python相关内容可查看本站专题：《》、《》、《》、《》、《》及《》

希望本文所述对大家Python程序设计有所帮助。

上一篇：负数与二进制换转方法

下一篇：三大UML建模工具Visio、Rational Rose、PowerDesign的区别比较

Python实现识别图片内容的方法分析

Python实现获取邮箱内容并解析的方法示例

Python基于opencv调用摄像头获取个人图片的实现方法

Python中利用Scipy包的SIFT方法进行图片识别的实例教程

Android编程实现图片平铺的方法分析

Python实现操纵控制windows注册表的方法分析

Python实现给文件添加内容及得到文件信息的方法

python简单实现旋转图片的方法

Python实现对字典分别按键(key)和值(value)进行排序的方法分析

python实现生成Word、docx文件的方法分析

JavaScript实现图片懒加载的方法分析