关于图片识别文字OCR踩坑
最近,PM让我去研究一下图片识别文字,我试了好多开源Soft。Tess4J,Tesseract-OCR,还有百度OCR。
直到我用了百度OCR,我只能告诉各位,真香。是真的香,谁用谁知道。这里我就给各位直接说下入门怎么去实现,他需要走百度去获取Access Token。简单粗暴的步骤如下。
先去写一个demo类。创建一个获取Token的类。类的代码如下
package com.baidu.ai.aip.auth; import org.json.JSONObject; import org.springframework.stereotype.Controller; import org.springframework.web.bind.annotation.PostMapping; import org.springframework.web.bind.annotation.RequestMapping; import org.springframework.web.bind.annotation.RestController; import java.io.BufferedReader; import java.io.InputStreamReader; import java.net.HttpURLConnection; import java.net.URL; import java.util.List; import java.util.Map; /** * 获取token类 */ public class AuthService { /** * 获取权限token * @return 返回示例: * { * "access_token": "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567", * "expires_in": 2592000 * } */ public static String getAuth() { // 官网获取的 API Key 更新为你注册的 String clientId = "cokAd9fLCTptAbIidbLIN5a8";//百度的AK // 官网获取的 Secret Key 更新为你注册的 String clientSecret = "D52nEA9BGPlQwvA1dM69GKd4m4dPiB7z";//百度的SK return getAuth(clientId, clientSecret); } /** * 获取API访问token * 该token有一定的有效期,需要自行管理,当失效时需重新获取. * @param ak - 百度云官网获取的 API Key * @param sk - 百度云官网获取的 Securet Key * @return assess_token 示例: * "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567" */ public static String getAuth(String ak, String sk) { // 获取token地址 String authHost = "https://aip.baidubce.com/oauth/2.0/token?"; String getAccessTokenUrl = authHost // 1. grant_type为固定参数 + "grant_type=client_credentials" // 2. 官网获取的 API Key + "&client_id=" + ak // 3. 官网获取的 Secret Key + "&client_secret=" + sk; try { URL realUrl = new URL(getAccessTokenUrl); // 打开和URL之间的连接 HttpURLConnection connection = (HttpURLConnection) realUrl.openConnection(); connection.setRequestMethod("GET"); connection.connect(); // 获取所有响应头字段 Map<String, List<String>> map = connection.getHeaderFields(); // 遍历所有的响应头字段 for (String key : map.keySet()) { System.err.println(key + "--->" + map.get(key)); } // 定义 BufferedReader输入流来读取URL的响应 BufferedReader in = new BufferedReader(new InputStreamReader(connection.getInputStream())); String result = ""; String line; while ((line = in.readLine()) != null) { result += line; } /** * 返回结果示例 */ System.err.println("result:" + result); JSONObject jsonObject = new JSONObject(result); String access_token = jsonObject.getString("access_token"); return access_token; } catch (Exception e) { System.err.printf("获取token失败!"); e.printStackTrace(System.err); } return null; } }
然后你再写一个main方法如下
package com.baidu.ai.aip.auth; public class Main { public static void main(String[] args) { AuthService authService = new AuthService(); String auth = AuthService.getAuth("cokAd9fLCTptAbIidbLIN5a8","D52nEA9BGPlQwvA1dM69GKd4m4dPiB7z"); System.out.println(auth); } }
这里参数一个是你自己注册的AK码还有SK码。
启动后会打印你的token令牌。然后去postman里写一个POST请求的接口,https://aip.baidubce.com/rest/2.0/ocr/v1/accurate?access_token=24.a67772908b7efb7c5feb0be718619f09.2592000.1597404417.282335-21374888
token替换你自己的token,然后在Headers里面写一个key:Content-Type Value:application/x-www-form-urlencoded
再在Body里指定x-www-form-urlencoded 格式,然后指定key:image Value:为你要识别的图片(图片需要转Base64码,百度一大堆搜一下,然后去掉“data:image/*;base64,”)然后调接口,就能得到图片里的文字了。然后时间一般保持在几十毫秒。只能说真香!
本文地址:https://blog.csdn.net/weixin_40883722/article/details/107369893
上一篇: vuex Module将 store 分割成模块的操作
下一篇: C# 泛型