c# 实现语音合成

程序员文章站 2022-07-05 20:09:20

本文主要讨论c#开发使用百度语音合成api在线将文本内容合成语音，保存为 mp3文件，本文最后会提供本安全源代码以及运行软件包，如有需要可自行下载开发流程如下：1.创建百度应用：　　创建应用之后就能看...

本文主要讨论c#开发使用百度语音合成api在线将文本内容合成语音，保存为 mp3 文件，本文最后会提供本安全源代码以及运行软件包，如有需要可自行下载

开发流程如下：

1. 创建百度应用：

　　创建应用之后就能看到创建完的应用和 api key 以及 secret key了，在调用api时需传入这些配置值

　　详见：

2. 引用 baidu.aip (sdk)

　　baidu.aip 封闭了文字识别ocr api 的http请求，简化代码，提高开发效率。如果不想引用该dll，可以自己封装http请求方法。

　　c# sdk 现已开源，快速接入文档参考：https://ai.baidu.com/ai-doc/speech/jk4nlz6gp

3. 调用api，

　　这里仅展示通用及高精度识别示例，特殊场景识别，详见官方文档：https://ai.baidu.com/ai-doc/speech/jk4nlz6gp

/// <summary>
  /// 语音合成
  /// </summary>
  /// <param name="reqitem">请求相关参数</param>
  /// <param name="destpath">mp3文件保存路径</param>
  /// <param name="synthesisevent">状态事件</param>
  /// <returns></returns>
  public static bool synthesis(reqsynthesis reqitem, string destpath, synthesisevent synthesisevent)
  {
   bool callresult = false;

   try
   {
    synthesisevent("语音合成初始化...");
    // 百度应用配置
    var apikey = configutil.getconfigstr(enumconfigkey.speechapi_key);
    var secretkey = configutil.getconfigstr(enumconfigkey.speechsecret_key);
    if (!riverauth.instant.checksynthesis(apikey, secretkey))
    {
     return false;
    }
    var client = new baidu.aip.speech.tts(apikey, secretkey);
    client.timeout = 60000; // 修改超时时间
    var option = new dictionary<string, object>()
    {
     {"vol", reqitem.vol}, // 
     { "pit", reqitem.pit}, // 
     {"spd", reqitem.spd}, // 语速
     {"per", reqitem.per} // 发音人，4：情感度丫丫童声
    };
    synthesisevent("开始语音合成...");
    var result = client.synthesis(reqitem.tex, option);
    // 保存文件
    if (result.success) // 或 result.success
    {
     file.writeallbytes(destpath, result.data);
     synthesisevent("语音合成返回成功，文件：" + destpath);
     callresult = true;
    }
    else
    {
     synthesisevent(string.format("语音合成失败, 错误码：[{0}], 原因：{1}", result.errorcode, result.errormsg));
    }
    riverauth.instant.endcallevent();
   }
   catch (exception ex)
   {
    synthesisevent("语音合成失败，原因：" + ex.message);
    loghelper.logerror(ex, "语音合成");
   }
   return callresult;
  }
 }
 /// <summary>
 /// 语音合成请求
 /// </summary>
 [serializable]
 public class reqsynthesis
 {
  public string tex { get; set; }//合成的文本，使用utf-8编码，请注意文本长度必须小于1024字节 必填项
  public string cuid { get; set; }// 用户唯一标识，用来区分用户，填写机器 mac 地址或 imei 码，长度为60以内 否
  public int spd { get; set; }//语速，取值0-9，默认为5中语速 否
  public int pit { get; set; }//音调，取值0-9，默认为5中语调 否
  public int vol { get; set; }//音量，取值0-15，默认为5中音量 否
  public int per { get; set; }//发音人选择, 0为女声，1为男声，3为情感合成-度逍遥，4为情感合成-度丫丫，默认为普通女
 }
 /// <summary>
 /// 语音转文字返回结果
 /// </summary>
 public class retspeech
 {
  public string corpus_no { get; set; }
  public string err_msg { get; set; }
  public int err_no { get; set; }
  public string[] result { get; set; }
  public string sn { get; set; }
 }

4. 语音合成最后保存为 mp3 文件

c# 实现语音合成

5. 源代码及软件包下载

软件开源代码地址(项目集成文字识别、语音合成、语音识别)：

运行软件包下载地址(.net framework 4.5)： https://pan.baidu.com/s/1z-wfdghhep8tqlqwp9i0mw 提取码: r3sk

作者：沐汐 vicky
出处：http://www.cnblogs.com/easyinvoice

以上就是c# 实现语音合成的详细内容，更多关于c# 语音合成的资料请关注其它相关文章！

c# 实现语音合成

开发流程如下：

C#实现winform中RichTextBox在指定光标位置插入图片的方法

C#编程实现动态改变配置文件信息的方法

C#递归方法实现无限级分类显示效果实例

C#使用WinRar命令进行压缩和解压缩操作的实现方法

使用python实现语音文件的特征提取方法

C#实现字体旋转的方法

C#实现图形路径变换的方法

C#实现Javascript的Splice

C#实现图形位置组合转换的方法

C#实现缩放字体的方法