Python 进行 OCR识别 -- pytesseract库
程序员文章站
2023-03-26 17:15:56
pip install pytesseract 报错:tesseract is not installed or it's not in your path 下载安装 Tesseract OCR https://pan.baidu.com/s/1qXumxdltxOnb0geaE_1U Q 修改 p ......
pip install pytesseract
报错:tesseract is not installed or it's not in your path
- 下载安装 tesseract-ocr
- 修改 pytesseract 源码中的路径
- 文件位置: python安装目录 \lib\site-packages\pytesseract\pytesseract.py
- 将 tesseract_cmd 的值 改为 tesseract-ocr 的安装路径\tesseract.exe
识别中文需要新的字库
- https://pan.baidu.com/s/1gfspc5uef73b2oa8yudbgq
- 将下载的中文库放在 tesseract-ocr 安装目录下的 tessdata 文件夹中
图片:english.png
图片:chinese.png
识别
import pytesseract from pil import image im_en = image.open('english.png') im_ch = image.open('chinese.png') print('========识别字母========') print(pytesseract.image_to_string(im_en), '\n\n') print('========识别中文========') print(pytesseract.image_to_string(im_ch, lang='chi_sim'))
结果
推荐阅读
-
谈谈Python进行验证码识别的一些想法
-
Python操作mongodb数据库进行模糊查询操作示例
-
python 使用tesseract进行图片识别
-
基于jupyter notebook的python编程(Win10通过OpenCv-3.4.1进行人脸口罩数据集的模型训练并进行戴口罩识别检测)
-
python 3调用百度OCR API实现剪贴板文字识别
-
Python 进行 OCR识别 -- pytesseract库
-
Python科学测量与计算库Pymeasure: 控制你的仪器进行自动测试和科学计算
-
Python用 KNN 进行验证码识别的实现方法
-
python 验证码识别库pytesseract的使用
-
python使用magic模块进行文件类型识别方法