python PaddleOCR库用法及知识点详解

程序员文章站 2022-06-16 08:26:27

说明1、paddleocr是基于深度学习的ocr识别库，中文识别精度相当还不错，能够应对大多数文字提取需求。2、需要依次安装三个依赖库，shapely库可能会受到系统的影响，出现安装错误。安装命令pi...

说明

1、paddleocr是基于深度学习的ocr识别库，中文识别精度相当还不错，能够应对大多数文字提取需求。

2、需要依次安装三个依赖库，shapely库可能会受到系统的影响，出现安装错误。

安装命令

pip install paddlepaddle
pip install shapely
pip install paddleocr

代码实现

 ocr = paddleocr(use_angle_cls=true,)
# 输入待识别图片路径
img_path = r"d:\desktop\4a34a16f-6b12-4ffc-88c6-fc86e4df6912.png"
# 输出结果保存路径
result = ocr.ocr(img_path, cls=true)
    for line in result:
        print(line)
 
from pil import image
image = image.open(img_path).convert('rgb')
boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
scores = [line[1][1] for line in result]
im_show = draw_ocr(image, boxes, txts, scores)
im_show = image.fromarray(im_show)
im_show.show()

内容扩展：

简介

paddleocr旨在打造一套丰富、领先、且实用的ocr工具库，助力使用者训练出更好的模型，并应用落地。

近期更新

2020.8.26 更新ocr相关的84个常见问题及解答，具体参考faq
2020.8.24 支持通过whl包安装使用paddleocr，具体参考paddleocr package使用说明
2020.8.21 更新8月18日b站直播课回放和ppt，课节2，易学易用的ocr工具大礼包，获取地址
2020.8.16 开源文本检测算法sast和文本识别算法srn
2020.7.23 发布7月21日b站直播课回放和ppt，课节1，paddleocr开源大礼包全面解读，获取地址
2020.7.15 添加基于easyedge和paddle-lite的移动端demo，支持ios和android系统

特性

超轻量级中文ocr模型，总模型仅8.6m
单模型支持中英文数字组合识别、竖排文本识别、长文本识别
检测模型db（4.1m）+识别模型crnn（4.5m）
实用通用中文ocr模型
多种预测推理部署方案，包括服务部署和端侧部署
多种文本检测训练算法，east、db、sast
多种文本识别训练算法，rosetta、crnn、star-net、rare、srn
可运行于linux、windows、macos等多种系统

到此这篇关于python paddleocr库用法及知识点详解的文章就介绍到这了,更多相关python paddleocr库的介绍内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持！

python PaddleOCR库用法及知识点详解

说明

安装命令

代码实现

简介

近期更新

特性

python super用法及原理详解

python super用法及原理详解

Python3中正则模块re.compile、re.match及re.search函数用法详解

Python实现连接MySql数据库及增删改查操作详解

Python3正则匹配re.split，re.finditer及re.findall函数用法详解

Python中optparser库用法实例详解

Python爬虫基础之XPath语法与lxml库的用法详解

python Web应用程序测试selenium库使用用法详解

python3中TQDM库安装及使用详解

python爬虫技术实例详解及数据可视化库