Python调用百度OCR实现图片文字识别
程序员文章站
2022-07-04 16:03:56
...
百度AI提供了一天50000次的免费文字识别额度,可以愉快的免费使用!下面直接上方法:
首先在百度AI创建一个应用,按照下图创建即可,创建后会获得如下:
创建后会获得如下信息:
APP_ID = '******'
API_KEY = '************'
SECRET_KEY = '**************'
下面就是百度API包的安装,在终端cmd输入如下语句直接pip方式安装,注意是 baidu-api 哦!
pip install --user baidu-aip
接下来上python代码,图片修改为你的图片就可以直接运行了:
from aip import AipOcr
# 定义常量
APP_ID = '21372704'
API_KEY = 'YKpXQwN5zj79g99fZK8i4Kn1'
SECRET_KEY = 'RTIAaFrvvgHbej7eALMKmjR0uF93rHCQ'
# 初始化AipFace对象
aipOcr = AipOcr(APP_ID, API_KEY, SECRET_KEY)
# 读取图片
filePath = "test.JPG"
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
# 定义参数变量
options = {
'detect_direction': 'true',
'language_type': 'CHN_ENG',
}
# 调用通用文字识别接口
result = aipOcr.basicGeneral(get_file_content(filePath), options)
print(result)
words_result=result['words_result']
for i in range(len(words_result)):
print(words_result[i]['words'])
#代码参考了:https://blog.csdn.net/u013421629/article/details/79500336?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase
图片不咋清晰就会出现识别出来不太准确的现象,但是对比pytesseract的OCR结果已经好了非常多,百度OCR识别出来原始的是字典格式。下面上例子:
上一篇: Halcon表面缺陷检测-光度立体法