欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

关于图片识别文字OCR踩坑

程序员文章站 2022-11-15 20:34:35
最近,PM让我去研究一下图片识别文字,我试了好多开源Soft。Tess4J,Tesseract-OCR,还有百度OCR。直到我用了百度OCR,我只能告诉各位,真香。是真的香,谁用谁知道。这里我就给各位直接说下入门怎么去实现,他需要走百度去获取Access Token。简单粗暴的步骤如下。先去写一个demo类。创建一个获取Token的类。类的代码如下package com.baidu.ai.aip.auth;import org.json.JSONObject;import org.spr...

最近,PM让我去研究一下图片识别文字,我试了好多开源Soft。Tess4J,Tesseract-OCR,还有百度OCR。

直到我用了百度OCR,我只能告诉各位,真香。是真的香,谁用谁知道。这里我就给各位直接说下入门怎么去实现,他需要走百度去获取Access Token。简单粗暴的步骤如下。

先去写一个demo类。创建一个获取Token的类。类的代码如下

package com.baidu.ai.aip.auth;

import org.json.JSONObject;
import org.springframework.stereotype.Controller;
import org.springframework.web.bind.annotation.PostMapping;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;

import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
import java.util.List;
import java.util.Map;

/**
 * 获取token类
 */

public class AuthService {

    /**
     * 获取权限token
     * @return 返回示例:
     * {
     * "access_token": "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567",
     * "expires_in": 2592000
     * }
     */
    public static String getAuth() {
        // 官网获取的 API Key 更新为你注册的
        String clientId = "cokAd9fLCTptAbIidbLIN5a8";//百度的AK
        // 官网获取的 Secret Key 更新为你注册的
        String clientSecret = "D52nEA9BGPlQwvA1dM69GKd4m4dPiB7z";//百度的SK
        return getAuth(clientId, clientSecret);
    }

    /**
     * 获取API访问token
     * 该token有一定的有效期,需要自行管理,当失效时需重新获取.
     * @param ak - 百度云官网获取的 API Key
     * @param sk - 百度云官网获取的 Securet Key
     * @return assess_token 示例:
     * "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567"
     */
    public static String getAuth(String ak, String sk) {
        // 获取token地址
        String authHost = "https://aip.baidubce.com/oauth/2.0/token?";
        String getAccessTokenUrl = authHost
                // 1. grant_type为固定参数
                + "grant_type=client_credentials"
                // 2. 官网获取的 API Key
                + "&client_id=" + ak
                // 3. 官网获取的 Secret Key
                + "&client_secret=" + sk;
        try {
            URL realUrl = new URL(getAccessTokenUrl);
            // 打开和URL之间的连接
            HttpURLConnection connection = (HttpURLConnection) realUrl.openConnection();
            connection.setRequestMethod("GET");
            connection.connect();
            // 获取所有响应头字段
            Map<String, List<String>> map = connection.getHeaderFields();
            // 遍历所有的响应头字段
            for (String key : map.keySet()) {
                System.err.println(key + "--->" + map.get(key));
            }
            // 定义 BufferedReader输入流来读取URL的响应
            BufferedReader in = new BufferedReader(new InputStreamReader(connection.getInputStream()));
            String result = "";
            String line;
            while ((line = in.readLine()) != null) {
                result += line;
            }
            /**
             * 返回结果示例
             */
            System.err.println("result:" + result);
            JSONObject jsonObject = new JSONObject(result);
            String access_token = jsonObject.getString("access_token");
            return access_token;
        } catch (Exception e) {
            System.err.printf("获取token失败!");
            e.printStackTrace(System.err);
        }
        return null;
    }

}

然后你再写一个main方法如下

package com.baidu.ai.aip.auth;

public class Main {
    public static void main(String[] args) {
        AuthService authService = new AuthService();
        String auth = AuthService.getAuth("cokAd9fLCTptAbIidbLIN5a8","D52nEA9BGPlQwvA1dM69GKd4m4dPiB7z");
        System.out.println(auth);
    }
}

这里参数一个是你自己注册的AK码还有SK码。

启动后会打印你的token令牌。然后去postman里写一个POST请求的接口,https://aip.baidubce.com/rest/2.0/ocr/v1/accurate?access_token=24.a67772908b7efb7c5feb0be718619f09.2592000.1597404417.282335-21374888

token替换你自己的token,然后在Headers里面写一个key:Content-Type  Value:application/x-www-form-urlencoded

再在Body里指定x-www-form-urlencoded 格式,然后指定key:image   Value:为你要识别的图片(图片需要转Base64码,百度一大堆搜一下,然后去掉“data:image/*;base64,”)然后调接口,就能得到图片里的文字了。然后时间一般保持在几十毫秒。只能说真香!

本文地址:https://blog.csdn.net/weixin_40883722/article/details/107369893

相关标签: ocr