python的图像识前的准备
程序员文章站
2024-03-16 11:02:58
...
python的图像识前的准备
安装tesseract-ocr
pytesseract的链接链接:https://pan.baidu.com/s/1zHLtVYnMiomVXx_gSxx1Cw
提取码:hco7
(内有安装程序和压缩包以及中文库)
###以安装程序为例安装pytesseract为例
运行.exe文件之后一路点击next和install
之后环境变量的配置一般情况自动配置好的
配置如下path:C:\Program Files (x86)\Tesseract-OCR
TESSDATA_PREFIX:C:\Program Files (x86)\Tesseract-OCR
##安装pillow库和pytesseract库
打开dos界面输入pip install pytesseract
pip install pillow 即可(前提是python要安装好)
##修改配置文件
找到python的安装目录的pytesseract.py文件 默认是C:\Users\Administrator\AppData\Local\Programs\Python\Python37\Lib\site-packages\pytesseract目录下
用记事本打开查找tesseract_cmd 结果如下
输入tesseract.exe的路径(上述图片是已经安装好的)
##导入中文库
将中文库tesseract-ocr-3.02.chi_sim.tar放在C:\Program Files (x86)\Tesseract-OCR\tessdata文件夹下即可
##测试该图片
import pytesseract
from PIL import Image
image=Image.open(r'D:/0.jpg')
code=pytesseract.image_to_string(image,lang='chi_sim')
print(code``)
该图片放在d盘根目录下为0.jpg
运行结果
识别数字代码和结果
import pytesseract
from PIL import Image
image=Image.open(r'D:\0.png')
code=pytesseract.image_to_string(image)
print(code)
上一篇: weex-加载js文件