c# 实现语音合成
本文主要讨论c#开发使用百度语音合成api在线将文本内容合成语音,保存为 mp3 文件,本文最后会提供本安全源代码以及运行软件包,如有需要可自行下载
开发流程如下:
1. 创建百度应用:
创建应用之后就能看到创建完的应用和 api key 以及 secret key了,在调用api时需传入这些配置值
详见:
2. 引用 baidu.aip (sdk)
baidu.aip 封闭了文字识别ocr api 的http请求,简化代码,提高开发效率。如果不想引用该dll,可以自己封装http请求方法。
c# sdk 现已开源,快速接入文档参考:https://ai.baidu.com/ai-doc/speech/jk4nlz6gp
3. 调用api,
这里仅展示通用及高精度识别示例,特殊场景识别,详见官方文档:https://ai.baidu.com/ai-doc/speech/jk4nlz6gp
/// <summary> /// 语音合成 /// </summary> /// <param name="reqitem">请求相关参数</param> /// <param name="destpath">mp3文件保存路径</param> /// <param name="synthesisevent">状态事件</param> /// <returns></returns> public static bool synthesis(reqsynthesis reqitem, string destpath, synthesisevent synthesisevent) { bool callresult = false; try { synthesisevent("语音合成初始化..."); // 百度应用配置 var apikey = configutil.getconfigstr(enumconfigkey.speechapi_key); var secretkey = configutil.getconfigstr(enumconfigkey.speechsecret_key); if (!riverauth.instant.checksynthesis(apikey, secretkey)) { return false; } var client = new baidu.aip.speech.tts(apikey, secretkey); client.timeout = 60000; // 修改超时时间 var option = new dictionary<string, object>() { {"vol", reqitem.vol}, // { "pit", reqitem.pit}, // {"spd", reqitem.spd}, // 语速 {"per", reqitem.per} // 发音人,4:情感度丫丫童声 }; synthesisevent("开始语音合成..."); var result = client.synthesis(reqitem.tex, option); // 保存文件 if (result.success) // 或 result.success { file.writeallbytes(destpath, result.data); synthesisevent("语音合成返回成功,文件:" + destpath); callresult = true; } else { synthesisevent(string.format("语音合成失败, 错误码:[{0}], 原因:{1}", result.errorcode, result.errormsg)); } riverauth.instant.endcallevent(); } catch (exception ex) { synthesisevent("语音合成失败,原因:" + ex.message); loghelper.logerror(ex, "语音合成"); } return callresult; } } /// <summary> /// 语音合成请求 /// </summary> [serializable] public class reqsynthesis { public string tex { get; set; }//合成的文本,使用utf-8编码,请注意文本长度必须小于1024字节 必填项 public string cuid { get; set; }// 用户唯一标识,用来区分用户,填写机器 mac 地址或 imei 码,长度为60以内 否 public int spd { get; set; }//语速,取值0-9,默认为5中语速 否 public int pit { get; set; }//音调,取值0-9,默认为5中语调 否 public int vol { get; set; }//音量,取值0-15,默认为5中音量 否 public int per { get; set; }//发音人选择, 0为女声,1为男声,3为情感合成-度逍遥,4为情感合成-度丫丫,默认为普通女 } /// <summary> /// 语音转文字返回结果 /// </summary> public class retspeech { public string corpus_no { get; set; } public string err_msg { get; set; } public int err_no { get; set; } public string[] result { get; set; } public string sn { get; set; } }
4. 语音合成最后保存为 mp3 文件
5. 源代码及软件包下载
软件开源代码地址(项目集成文字识别、语音合成、语音识别):
运行软件包下载地址(.net framework 4.5): https://pan.baidu.com/s/1z-wfdghhep8tqlqwp9i0mw 提取码: r3sk
作者:沐汐 vicky
出处:http://www.cnblogs.com/easyinvoice
以上就是c# 实现语音合成的详细内容,更多关于c# 语音合成的资料请关注其它相关文章!
上一篇: 去哪儿旅行app如何查看我的游记?
下一篇: AU怎么设置细腻的人声合唱效果?