欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

JAVA基于百度云文字(车牌、身份证、图片)识别提取

程序员文章站 2024-03-15 23:43:30
...

基于百度云文字(车牌、身份证、图片)识别提取

由于自己想写一个停车场项目,所以去查询了百度API文档,可以实现所有图片中文字的提取,此贴为傻瓜式教程,希望所有像我一样的初学者都可以看懂,有所收获,话不多说,转入正题。
参考官方API文档

一、事先准备
1.两个jar包
json.jar提取码:ly10
gson-2.8.0.jar提取码:w4dn
当然如果是Maven工程,可自行到Maven官方查找依赖
2.需要提前准备的四个工具类,(在官方文档的注释中也有链接地址,在此我直接给出)
FileUtil
Base64Util
HttpUtil
GsonUtils

二、人工智能程序的创建以及AK、SK的获取
1.打开百度,搜索“百度云”
JAVA基于百度云文字(车牌、身份证、图片)识别提取
2.进入官网,点击右上角——管理控制台
JAVA基于百度云文字(车牌、身份证、图片)识别提取
此时,如果你没登录的话,会要求你登录,自行登录吧,没账号的注册个,这就不墨迹了。
3.选择文字识别
JAVA基于百度云文字(车牌、身份证、图片)识别提取
4.创建应用
JAVA基于百度云文字(车牌、身份证、图片)识别提取
5.填写应用信息
JAVA基于百度云文字(车牌、身份证、图片)识别提取
JAVA基于百度云文字(车牌、身份证、图片)识别提取
6.寻找AK、SK
创建完成应用后,点击查看应用详情,此时终于拿到了AK和SK,保存好,一会后面要用到
JAVA基于百度云文字(车牌、身份证、图片)识别提取
三、写个小程序测一哈
1.整个Java工程,把之前我们下载的两个jar包倒入了,Maven工程自己去配置pom.xml文件里依赖。
2.再整个包,把之前下载的4个工具类塞进去
JAVA基于百度云文字(车牌、身份证、图片)识别提取
此时去各个类里导导包啥的,就不报错了。
3.鉴权认证机制
官方API中给了获取token的类,拿来直接用,只需要将之前我们辛辛苦苦得到的AK,SK替换到代码中。

package com.baidu.ai.aip.auth;

import org.json.JSONObject;

import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
import java.util.List;
import java.util.Map;

/**
 * 获取token类
 */
public class AuthService {

    /**
     * 获取权限token
     * @return 返回示例:
     * {
     * "access_token": "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567",
     * "expires_in": 2592000
     * }
     */
    public static String getAuth() {
        // 官网获取的 API Key 更新为你注册的
        String clientId = "百度云应用的AK";
        // 官网获取的 Secret Key 更新为你注册的
        String clientSecret = "百度云应用的SK";
        return getAuth(clientId, clientSecret);
    }

    /**
     * 获取API访问token
     * 该token有一定的有效期,需要自行管理,当失效时需重新获取.
     * @param ak - 百度云官网获取的 API Key
     * @param sk - 百度云官网获取的 Securet Key
     * @return assess_token 示例:
     * "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567"
     */
    public static String getAuth(String ak, String sk) {
        // 获取token地址
        String authHost = "https://aip.baidubce.com/oauth/2.0/token?";
        String getAccessTokenUrl = authHost
                // 1. grant_type为固定参数
                + "grant_type=client_credentials"
                // 2. 官网获取的 API Key
                + "&client_id=" + ak
                // 3. 官网获取的 Secret Key
                + "&client_secret=" + sk;
        try {
            URL realUrl = new URL(getAccessTokenUrl);
            // 打开和URL之间的连接
            HttpURLConnection connection = (HttpURLConnection) realUrl.openConnection();
            connection.setRequestMethod("GET");
            connection.connect();
            // 获取所有响应头字段
            Map<String, List<String>> map = connection.getHeaderFields();
            // 遍历所有的响应头字段
            for (String key : map.keySet()) {
                System.err.println(key + "--->" + map.get(key));
            }
            // 定义 BufferedReader输入流来读取URL的响应
            BufferedReader in = new BufferedReader(new InputStreamReader(connection.getInputStream()));
            String result = "";
            String line;
            while ((line = in.readLine()) != null) {
                result += line;
            }
            /**
             * 返回结果示例
             */
            System.err.println("result:" + result);
            JSONObject jsonObject = new JSONObject(result);
            String access_token = jsonObject.getString("access_token");
            return access_token;
        } catch (Exception e) {
            System.err.printf("获取token失败!");
            e.printStackTrace(System.err);
        }
        return null;
    }

}

4.图片文字识别
需要将文件路径给出,比如我们随便弄个图,放在src下,起个名,路径为"src/daben.png"
JAVA基于百度云文字(车牌、身份证、图片)识别提取
调用鉴权接口获取的token
这里就可以用到刚才AuthService类的getAuth()方法,得到字符串,赋值给accessToken

package com.baidu.ai.aip;

import com.baidu.ai.aip.utils.Base64Util;
import com.baidu.ai.aip.utils.FileUtil;
import com.baidu.ai.aip.utils.HttpUtil;

import java.net.URLEncoder;

/**
* 网络图片文字识别
*/
public class WebImage {

    /**
    * 重要提示代码中所需工具类
    * FileUtil,Base64Util,HttpUtil,GsonUtils请从
    * https://ai.baidu.com/file/658A35ABAB2D404FBF903F64D47C1F72
    * https://ai.baidu.com/file/C8D81F3301E24D2892968F09AE1AD6E2
    * https://ai.baidu.com/file/544D677F5D4E4F17B4122FBD60DB82B3
    * https://ai.baidu.com/file/470B3ACCA3FE43788B5A963BF0B625F3
    * 下载
    */
    public static String webImage() {
        // 请求url
        String url = "https://aip.baidubce.com/rest/2.0/ocr/v1/webimage";
        try {
            // 本地文件路径
            String filePath = "src/daben.png";//[本地文件路径]
            byte[] imgData = FileUtil.readFileByBytes(filePath);
            String imgStr = Base64Util.encode(imgData);
            String imgParam = URLEncoder.encode(imgStr, "UTF-8");

            String param = "image=" + imgParam;

            // 注意这里仅为了简化编码每一次请求都去获取access_token,线上环境access_token有过期时间, 客户端可自行缓存,过期后重新获取。
            String accessToken = AuthService.getAuth();//[调用鉴权接口获取的token]

            String result = HttpUtil.post(url, accessToken, param);
            System.out.println(result);
            return result;
        } catch (Exception e) {
            e.printStackTrace();
        }
        return null;
    }

    public static void main(String[] args) {
        WebImage.webImage();
    }
}

四、运行一下吧
万事具备,运行你的程序,终于得到了想要的结果
JAVA基于百度云文字(车牌、身份证、图片)识别提取
当然你也可以找些身份,户口本,网络图片,随便试试,刚觉还不错,只是对艺术字好像识别差点火候。
有不明白的地方可以留言,看到必回。

五、问题补充
如果识别车牌不合适,不够准确,也可以使用官网文档专门的车牌识别的代码,下面附上官方API文档
车牌识别官方文档
JAVA基于百度云文字(车牌、身份证、图片)识别提取

相关标签: 文字识别