欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

C#调用百度翻译实现翻译HALCON的示例

程序员文章站 2022-03-06 10:58:32
准备工作halcon示例程序的描述部分一直是英文的,看起来很不方便。我决定汉化一下halcon示例程序的描述,准备工作如下:拿到halcon的例程描述文件index_examples_en_us.xm...

准备工作

halcon示例程序的描述部分一直是英文的,看起来很不方便。我决定汉化一下halcon示例程序的描述,准备工作如下:

拿到halcon的例程描述文件index_examples_en_us.xml,我的在c:\program files\mvtec\halcon-18.11-progress\help,其它版本类似。在注册拿到自己的id和密钥,开通通用翻译api服务。

注:百度官方有提供通用翻译api的使用demo,不过比较简单,c# demo下载

参数简介

通用翻译api的https 地址为,使用方法参考通用翻译api接入文档

输入参数

请求方式可使用 get 或 post 方式(content-type 请指定为:application/x-www-form-urlencoded),字符编码统一采用 utf-8 编码格式,单次请求长度控制在 6000 bytes以内(汉字约为输入参数 2000 个)。
将api需要的输入参数封装为一个类(id和密钥换成自己的),代码如下:

/// <summary>
/// 输入产数
/// </summary>
class inputquery
{
    /// <summary>
    /// app id
    /// </summary>
    private static string appid = "2021xxxxxxx0626";
    /// <summary>
    /// 密钥
    /// </summary>
    private static string password = "cnblongsxtimefiles";


    /// <summary>
    /// 请求翻译query utf-8编码
    /// </summary>
    public string content { get; set; }
    /// <summary>
    /// 翻译源语言 可设置为auto
    /// </summary>
    public string from { get; set; }
    /// <summary>
    /// 翻译目标语言 不可设置为auto
    /// </summary>
    public string to { get; set; }
    /// <summary>
    /// app id
    /// </summary>
    public string appid { get; set; }
    /// <summary>
    /// 随机数 可为字母或数字的字符串
    /// </summary>
    public string salt { get; set; }
    /// <summary>
    /// 签名 appid+q+salt+密钥的md5值
    /// </summary>
    public string sign { get; set; }

    /// <summary>
    /// 构造函数
    /// </summary>
    /// <param name="content">翻译内容</param>
    /// <param name="fromstr">源语言</param>
    /// <param name="tostr">目标语言</param>
    public inputquery(string content, string fromstr, string tostr)
    {
        content = content;
        from = fromstr;
        to = tostr;
        appid = appid;

        string randomnum = new random().next().tostring();
        string md5sign = getmd5(appid + content + randomnum + password).tolower();
        salt = randomnum;
        sign = md5sign;
    }

    /// <summary>
    /// 计算字符串的md5值
    /// </summary>
    static string getmd5(string source)
    {
        md5cryptoserviceprovider md5 = new md5cryptoserviceprovider();
        byte[] data = encoding.utf8.getbytes(source);
        byte[] md5data = md5.computehash(data, 0, data.length);
        md5.clear();

        string deststring = string.empty;
        for (int i = 0; i < md5data.length; i++)
        {
            deststring += convert.tostring(md5data[i], 16).padleft(2, '0');
        }
        deststring = deststring.padleft(32, '0');
        return deststring;
    }
}

输出参数

api返回的结果是json格式,需要反序列为对象实例后再进行处理。为了减少第三方库的依赖,反序列化使用.net自带的datacontractjsonserializer。
封装的输出参数类代码如下:

/// <summary>
/// 输出参数
/// </summary>
[datacontract]
class outputresult
{
    
    /// <summary>
    /// 错误码 仅当出现错误时显示
    /// </summary>
    [datamember(name = "error_code")]
    public string error_code { set; get; }

    /// <summary>
    /// 错误信息
    /// </summary>
    [datamember(name = "error_msg")]
    public string error_msg { set; get; }

    /// <summary>
    /// 源语言 返回用户指定的语言,或者自动检测出的语种(源语言设为 auto 时)
    /// </summary>
    [datamember(name = "from")]
    public string from { set; get; }

    /// <summary>
    /// 目标语言 返回用户指定的目标语言
    /// </summary>
    [datamember(name = "to")]
    public string to { set; get; }

    /// <summary>
    /// 翻译结果 返回翻译结果,包括 src 和 dst 字段
    /// </summary>
    [datamember(name = "trans_result")]
    public translatecontent[] trans_result { set; get; }
}
/// <summary>
/// 翻译结果
/// </summary>
[datacontract]
class translatecontent
{
    /// <summary>
    /// 原文
    /// </summary>
    [datamember(name = "src")]
    public string src { set; get; }

    /// <summary>
    /// 译文
    /// </summary>
    [datamember(name = "dst")]
    public string dst { set; get; }
}

使用httpclient

调用api需要一个类发送 http 请求以及接收http响应,推荐使用httpclient类(微软不建议使用webclient、httpwebrequest类)。
需要注意的是:httpclient 用于在应用程序的整个生存期内实例化一次并重复使用,也就是说一个应用程序只需要一个httpclient单例即可,代码如下:

public class goodcontroller
{
    public static readonly httpclient httpclient;

    static goodcontroller()
    {
        httpclient = new httpclient();
    }
}

翻译工具类

将api的调用方法封装成一个translate类,目前只提供一个英翻中的方法,其它翻译需求可以参考 自己扩展。
translate类代码如下(注意添加system.web依赖项):

/// <summary>
/// 百度通用翻译api工具类
/// </summary>
class translate
{
    /*
     * 代码链接:https://www.cnblogs.com/timefiles/p/baidutranslateapi.html
     * 创建时间:2021/06/26
     * 主页链接:https://www.cnblogs.com/timefiles/
     * 
     * 常用的语种代码:
     * 自动检测	auto	
     * 中文	zh	
     * 英语	en
     * 日语	jp
     */

    /// <summary>
    /// 英文翻译为中文
    /// </summary>
    /// <param name="content">翻译内容</param>
    /// <returns></returns>
    public static string entozh(string content)
    {
        string languagefrom = "en", languageto = "zh";
        return gettranslateresult(content, languagefrom, languageto);
    }

    /// <summary>
    /// 获取翻译结果
    /// </summary>
    /// <param name="content">翻译内容</param>
    /// <param name="fromstr">源语言</param>
    /// <param name="tostr">目标语言</param>
    /// <returns></returns>
    static string gettranslateresult(string content, string fromstr, string tostr)
    {
        inputquery input = new inputquery(content, fromstr, tostr);
        uri uri = geturi(input);
        var task = getoutputresultasync(uri);
        //个人认证后api的每秒请求量最高为10,异步意义不大,直接使用同步的方式
        outputresult output = task.result;
        if (output.error_code == null)
        {
            return output.trans_result[0].dst;
        }
        else
        {
            throw new exception("翻译异常,错误代码:" + output.error_msg);
        }
    }

    /// <summary>
    /// 获取请求uri
    /// </summary>
    /// <param name="input"></param>
    /// <returns></returns>
    static uri geturi(inputquery input)
    {
        var query = httputility.parsequerystring(string.empty);
        query["q"] = input.content;
        query["from"] = input.from;
        query["to"] = input.to;
        query["appid"] = input.appid;
        query["salt"] = input.salt;
        query["sign"] = input.sign;

        //构造uri,不建议直接拼字符串
        uribuilder uribur = new uribuilder("http://api.fanyi.baidu.com/api/trans/vip/translate");
        uribur.query = query.tostring();
        //uri会自动进行转义
        return uribur.uri;
    }

    /// <summary>
    /// 获取api返回的结果
    /// </summary>
    /// <param name="uri">请求的uri</param>
    /// <returns></returns>
    static async task<outputresult> getoutputresultasync(uri uri)
    {
        outputresult result = null;
        var response = await goodcontroller.httpclient.getstringasync(uri);
        var ser = new datacontractjsonserializer(typeof(outputresult));
        using (var ms = new memorystream(encoding.utf8.getbytes(response)))
        {
            result = (outputresult)ser.readobject(ms);
        }
        return result;
    }
}

个人认证后api的每秒请求量最高为10,此处使用同步方式获取翻译结果,有异步需求的可以自己更改。

应用:翻译halcon的示例描述

static void main(string[] args)
{
    xmldocument xd = new xmldocument();
    xd.load("index_examples_en_us.xml");
    //查找固定名称 节点名要从根节点开始写
    xmlnodelist nodelist = xd.documentelement.selectnodes("/examples/example/desc");
    for (int i = 0; i < nodelist.count; i++)
    {
        string desc = nodelist[i].innertext;
        //百度翻译有时不太准确,建议保留原文
        nodelist[i].innertext = translate.entozh(desc)+"("+ nodelist[i].innertext+")";               
        console.writeline("翻译结果"+i+":" + nodelist[i].innertext);
        console.writeline();
    }

    streamwriter sw = new streamwriter("index_examples_en_us_翻译.xml", false, new utf8encoding(false));
    //为了和原文件保存一致,原文件是使用的是"\n"换行
    sw.newline = "\n";
    xd.save(sw);
    sw.close();                  
    console.writeline("完成");
    console.read();
}

注:大概有1000多条需要翻译,需要等待10几分钟。考虑过使用特定字符组合成几个大字符串翻译后再拆分,但特定字符在翻译过程中有丢失导致拆分失败,只能使用这种方式。

将原halcon的xml文件重命名作为备份,将翻译后的文件复制到halcon程序目录下命名为index_examples_en_us.xml,效果如下:

C#调用百度翻译实现翻译HALCON的示例

到此这篇关于c#调用百度翻译实现翻译halcon的示例 的文章就介绍到这了,更多相关c# 翻译halcon内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!