JAVA基于百度云文字(车牌、身份证、图片)识别提取
基于百度云文字(车牌、身份证、图片)识别提取
由于自己想写一个停车场项目,所以去查询了百度API文档,可以实现所有图片中文字的提取,此贴为傻瓜式教程,希望所有像我一样的初学者都可以看懂,有所收获,话不多说,转入正题。
参考官方API文档
一、事先准备
1.两个jar包
json.jar提取码:ly10
gson-2.8.0.jar提取码:w4dn
当然如果是Maven工程,可自行到Maven官方查找依赖
2.需要提前准备的四个工具类,(在官方文档的注释中也有链接地址,在此我直接给出)
FileUtil
Base64Util
HttpUtil
GsonUtils
二、人工智能程序的创建以及AK、SK的获取
1.打开百度,搜索“百度云”
2.进入官网,点击右上角——管理控制台
此时,如果你没登录的话,会要求你登录,自行登录吧,没账号的注册个,这就不墨迹了。
3.选择文字识别
4.创建应用
5.填写应用信息
6.寻找AK、SK
创建完成应用后,点击查看应用详情,此时终于拿到了AK和SK,保存好,一会后面要用到
三、写个小程序测一哈
1.整个Java工程,把之前我们下载的两个jar包倒入了,Maven工程自己去配置pom.xml文件里依赖。
2.再整个包,把之前下载的4个工具类塞进去
此时去各个类里导导包啥的,就不报错了。
3.鉴权认证机制
官方API中给了获取token的类,拿来直接用,只需要将之前我们辛辛苦苦得到的AK,SK替换到代码中。
package com.baidu.ai.aip.auth;
import org.json.JSONObject;
import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
import java.util.List;
import java.util.Map;
/**
* 获取token类
*/
public class AuthService {
/**
* 获取权限token
* @return 返回示例:
* {
* "access_token": "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567",
* "expires_in": 2592000
* }
*/
public static String getAuth() {
// 官网获取的 API Key 更新为你注册的
String clientId = "百度云应用的AK";
// 官网获取的 Secret Key 更新为你注册的
String clientSecret = "百度云应用的SK";
return getAuth(clientId, clientSecret);
}
/**
* 获取API访问token
* 该token有一定的有效期,需要自行管理,当失效时需重新获取.
* @param ak - 百度云官网获取的 API Key
* @param sk - 百度云官网获取的 Securet Key
* @return assess_token 示例:
* "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567"
*/
public static String getAuth(String ak, String sk) {
// 获取token地址
String authHost = "https://aip.baidubce.com/oauth/2.0/token?";
String getAccessTokenUrl = authHost
// 1. grant_type为固定参数
+ "grant_type=client_credentials"
// 2. 官网获取的 API Key
+ "&client_id=" + ak
// 3. 官网获取的 Secret Key
+ "&client_secret=" + sk;
try {
URL realUrl = new URL(getAccessTokenUrl);
// 打开和URL之间的连接
HttpURLConnection connection = (HttpURLConnection) realUrl.openConnection();
connection.setRequestMethod("GET");
connection.connect();
// 获取所有响应头字段
Map<String, List<String>> map = connection.getHeaderFields();
// 遍历所有的响应头字段
for (String key : map.keySet()) {
System.err.println(key + "--->" + map.get(key));
}
// 定义 BufferedReader输入流来读取URL的响应
BufferedReader in = new BufferedReader(new InputStreamReader(connection.getInputStream()));
String result = "";
String line;
while ((line = in.readLine()) != null) {
result += line;
}
/**
* 返回结果示例
*/
System.err.println("result:" + result);
JSONObject jsonObject = new JSONObject(result);
String access_token = jsonObject.getString("access_token");
return access_token;
} catch (Exception e) {
System.err.printf("获取token失败!");
e.printStackTrace(System.err);
}
return null;
}
}
4.图片文字识别
需要将文件路径给出,比如我们随便弄个图,放在src下,起个名,路径为"src/daben.png"
调用鉴权接口获取的token
这里就可以用到刚才AuthService类的getAuth()方法,得到字符串,赋值给accessToken
package com.baidu.ai.aip;
import com.baidu.ai.aip.utils.Base64Util;
import com.baidu.ai.aip.utils.FileUtil;
import com.baidu.ai.aip.utils.HttpUtil;
import java.net.URLEncoder;
/**
* 网络图片文字识别
*/
public class WebImage {
/**
* 重要提示代码中所需工具类
* FileUtil,Base64Util,HttpUtil,GsonUtils请从
* https://ai.baidu.com/file/658A35ABAB2D404FBF903F64D47C1F72
* https://ai.baidu.com/file/C8D81F3301E24D2892968F09AE1AD6E2
* https://ai.baidu.com/file/544D677F5D4E4F17B4122FBD60DB82B3
* https://ai.baidu.com/file/470B3ACCA3FE43788B5A963BF0B625F3
* 下载
*/
public static String webImage() {
// 请求url
String url = "https://aip.baidubce.com/rest/2.0/ocr/v1/webimage";
try {
// 本地文件路径
String filePath = "src/daben.png";//[本地文件路径]
byte[] imgData = FileUtil.readFileByBytes(filePath);
String imgStr = Base64Util.encode(imgData);
String imgParam = URLEncoder.encode(imgStr, "UTF-8");
String param = "image=" + imgParam;
// 注意这里仅为了简化编码每一次请求都去获取access_token,线上环境access_token有过期时间, 客户端可自行缓存,过期后重新获取。
String accessToken = AuthService.getAuth();//[调用鉴权接口获取的token]
String result = HttpUtil.post(url, accessToken, param);
System.out.println(result);
return result;
} catch (Exception e) {
e.printStackTrace();
}
return null;
}
public static void main(String[] args) {
WebImage.webImage();
}
}
四、运行一下吧
万事具备,运行你的程序,终于得到了想要的结果
当然你也可以找些身份,户口本,网络图片,随便试试,刚觉还不错,只是对艺术字好像识别差点火候。
有不明白的地方可以留言,看到必回。
五、问题补充
如果识别车牌不合适,不够准确,也可以使用官网文档专门的车牌识别的代码,下面附上官方API文档
车牌识别官方文档
上一篇: Weex基于Android Studio从开发环境搭建到运行
下一篇: Django的中间件