Unity实现OCR文字识别功能

程序员文章站 2022-03-15 20:13:19

首先登陆百度开发者中心，搜索文字识别服务：创建一个应用，获取appid、apikey、secretkey秘钥信息：下载c# sdk，将aipsdk.dll动态库导入unity：本文以通用文字识别为例，...

首先登陆百度开发者中心，搜索文字识别服务：

Unity实现OCR文字识别功能

创建一个应用，获取appid、apikey、secretkey秘钥信息：

Unity实现OCR文字识别功能

下载c# sdk，将aipsdk.dll动态库导入unity：

Unity实现OCR文字识别功能

本文以通用文字识别为例，查阅官方文档，以下是通用文字识别的返回数据结构：

Unity实现OCR文字识别功能

在unity中定义相应的数据结构：

using system;
 
/// <summary>
/// 通用文字识别
/// </summary>
[serializable]
public class generalocr
{
    /// <summary>
    /// 图像方向 -1未定义 0正弦 1逆时针90度 2逆时针180度 3逆时针270度
    /// </summary>
    public int direction;
    /// <summary>
    /// 唯一的log id，用于问题定位
    /// </summary>
    public int log_id;
    /// <summary>
    /// 识别结果数，表示words_result的元素个数
    /// </summary>
    public int words_result_num;
    /// <summary>
    /// 定位和识别结果数组
    /// </summary>
    public string[] words_result;
    /// <summary>
    /// 行置信度信息
    /// </summary>
    public probability probability;
}
 
/// <summary>
/// 行置信度信息
/// </summary>
[serializable]
public class probability
{
    /// <summary>
    /// 行置信度平均值
    /// </summary>
    public int average;
    /// <summary>
    /// 行置信度方差
    /// </summary>
    public int variance;
    /// <summary>
    /// 行置信度最小值
    /// </summary>
    public int min;
}

下面是调用时传入的相关参数：

Unity实现OCR文字识别功能

封装调用函数：

using system;
using system.collections.generic;
using unityengine;
 
public class ocr 
{
    //以下信息于百度开发者中心创建应用获取
    private const string appid = "";
    private const string apikey = "";
    private const string secretkey = "";
 
    /// <summary>
    /// 通用文字识别
    /// </summary>
    /// <param name="bytes">图片字节数据</param>
    /// <param name="language">识别语言类型 默认chn_eng中英文混合</param>
    /// <param name="detectdirection">是否检测图像朝向</param>
    /// <param name="detectlanguage">是否检测语言，当前支持中、英、日、韩</param>
    /// <param name="probability">是否返回识别结果中每一行的置信度</param>
    /// <returns></returns>
    public static generalocr general(byte[] bytes, string language = "chn_eng", bool detectdirection = false, bool detectlanguage = false, bool probability = false)
    {
        var client = new baidu.aip.ocr.ocr(apikey, secretkey);
        try
        {
            var options = new dictionary<string, object>
            {
                { "language_type", language },
                { "detect_direction", detectdirection },
                { "detect_language", detectlanguage },
                { "probability", probability }
            };
            var response = client.generalbasic(bytes, options);
            generalocr generalocr = jsonutility.fromjson<generalocr>(response.tostring());
            return generalocr;
        }
        catch (exception error)
        {
            debug.logerror(error);
        }
        return null;
    }
}

以上是传入图片字节数据调用接口的方式，也可以通过url调用，只需将generalbasic换为重载函数generalbasicurl：

Unity实现OCR文字识别功能

测试图片：

Unity实现OCR文字识别功能

ocr.general(file.readallbytes(application.datapath + "/picture.jpg"));

Unity实现OCR文字识别功能

以上就是unity实现ocr文字识别功能的详细内容，更多关于unity ocr文字识别的资料请关注其它相关文章！

Unity实现OCR文字识别功能

Java OCR tesseract 图像智能文字字符识别技术实例代码

android实现汉字转拼音功能带多音字识别

基于Python实现对PDF文件的OCR识别

WinForm实现为TextBox设置水印文字功能

Android实现扫一扫识别数字功能

基于Python实现对PDF文件的OCR识别

C# SDK实现百度云OCR的文字识别功能

Unity3D实现批量下载图片功能

Java OCR tesseract 图像智能文字字符识别技术实例代码

Android实现手势滑动识别功能

Unity实现OCR文字识别功能

Java OCR tesseract 图像智能文字字符识别技术实例代码

android实现汉字转拼音功能 带多音字识别

基于Python实现对PDF文件的OCR识别

WinForm实现为TextBox设置水印文字功能

Android实现扫一扫识别数字功能

基于Python实现对PDF文件的OCR识别

C# SDK实现百度云OCR的文字识别功能

Unity3D实现批量下载图片功能

Java OCR tesseract 图像智能文字字符识别技术实例代码

Android实现手势滑动识别功能

android实现汉字转拼音功能带多音字识别