Android基于讯飞语音SDK实现语音识别

程序员文章站 2024-03-02 19:14:46

一、准备工作 1、你需要android手机应用开发基础 2、科大讯飞语音识别sdk android版 3、科大讯飞语音识别开发api文档 4、android手机...

一、准备工作

1、你需要android手机应用开发基础

2、科大讯飞语音识别sdk android版

3、科大讯飞语音识别开发api文档

4、android手机

关于科大讯飞sdk及api文档，请到科大语音官网下载：

当然sdk和api有多个版本可选，按照你的需要下载，其次，下载需要填写资料申请注册，申请通过或可获得appid

如下图，申请一个appid，就可以了。

Android基于讯飞语音SDK实现语音识别

二、语音识别流程

1、创建识别控件

函数原型

public recognizerdialog(context context,string params)

其中context表示当前上下文环境，传this即可

params有参数详见api文档

2、用appid登录到科大讯飞服务器（自动连接，需要联网）

主要用到speechuser（com.iflytek.speech包下）类下的getuser().login()函数

其中getuser()表示获取用户对象，可以实现用户登录，注销等操作

login函数原型

public boolean login(context context,string usr,string pwd,string

参数详见api文档

3、读取语言识别语法

详见api文档

4、设置识别参数及识别监听器

通过recognizerdialog下的setengine()方法设置参数

函数原型

public void setengine(string engine,string params,string grammar)

详细的参数请参考api文档

5、识别结果回调

需要实现recognizerdialoglistener接口，其中有两个方法需要重写，分别是

1)public void onresults(arraylist<recognizerresult> results,boolean islast)

其中result是recognizerresult对象的集合，recognizerresult的属性有

string text 识别文本

int confidence 识别可信度

2)public void onend(speecherror error)

6、识别结果处理（自行处理）

自己将文本进行处理。

三、详细开发过程

1、新建android项目

和普通的android项目一样，只是需要加入科大讯飞语言sdk包，主要包括

msc.jar及libmsc.so动态库文件，项目lib截图

Android基于讯飞语音SDK实现语音识别

2、布局

这里只进行简单的布局，只设置一个按钮作为语言识别按钮及一个文本组件用作显示识别结果，布局文件如下：

<linearlayout xmlns:android="http://schemas.android.com/apk/res/android"
  xmlns:tools="http://schemas.android.com/tools"
  android:layout_width="fill_parent"
  android:layout_height="fill_parent"
  android:orientation="vertical"
  tools:context="${relativepackage}.${activityclass}" >

  <edittext
    android:id="@+id/edittext"
    android:layout_width="fill_parent"
    android:layout_height="300dp"
    android:gravity="top"
    android:inputtype="textmultiline" >
    
    <requestfocus />
   </edittext>
   <button
     android:id="@+id/button_start"
     android:layout_width="wrap_content"
     android:layout_height="wrap_content"
     android:text="点击开始说话" />
     
</linearlayout>

3、main.java代码如下：

public class main extends activity {

  // 组件
  private button button = null;
  private textview result = null;
  private toast mtoast = null;

  // 语音识别
  private final string app_id = "这里改成自己的app_id";
  private recognizerdialog recognizerdialog = null;

  @override
  protected void oncreate(bundle savedinstancestate) {
    super.oncreate(savedinstancestate);
    super.setcontentview(r.layout.main);

    button = (button) super.findviewbyid(r.id.button_start);
    result = (textview) super.findviewbyid(r.id.edittext);

    // 初始化识别
    mtoast = toast.maketext(this, "", toast.length_short);
    mtoast.setmargin(0f, 0.2f);
    recognizerdialog = new recognizerdialog(this, "appid=" + app_id);
    speechuser.getuser().login(this, null, null, "appid=" + app_id, loginlistener);

    this.button.setonclicklistener(new btn());

  }

  private class btn implements onclicklistener {

    @override
    public void onclick(view v) {

      //mainactivity.this.voice.setimageresource(r.drawable.voicelight);
      recognizerdialog.setlistener(mrecolistener);
      recognizerdialog.setengine(null, "grammar_type=abnf", grammartext);
      recognizerdialog.show();
    }
  }

  // 语音识别用户登录监听器
  private speechlistener loginlistener = new speechlistener() {

    @override
    public void ondata(byte[] arg0) {
    }

    @override
    public void onevent(int arg0, bundle arg1) {
    }

    @override
    public void onend(speecherror arg0) {
      // todo auto-generated method stub
      if (arg0 != null) {
        mtoast.settext("登录失败");
        mtoast.show();
      } else {
        mtoast.settext("登录成功");
        mtoast.show();
      }
    }
  };

  // 识别结果回调
  private recognizerdialoglistener mrecolistener = new recognizerdialoglistener() {

    @override
    public void onend(speecherror error) {
      //mainactivity.this.voice.setimageresource(r.drawable.voice);
    }

    @override
    public void onresults(arraylist<recognizerresult> results, boolean islast) {
      // todo auto-generated method stub
      string text = "";
      text = results.get(0).text;
      mtoast.settext("识别结果为：" + text);
      mtoast.show();
      result.settext("识别结果为：" + text);
    }

  };

}

4、需要的权限：

  <uses-permission android:name="android.permission.internet"/>
  <uses-permission android:name="android.permission.record_audio"/>
  <uses-permission android:name="android.permission.access_network_state"/>
  <uses-permission android:name="android.permission.access_wifi_state"/>
  <uses-permission android:name="android.permission.change_network_state"/>
  <uses-permission android:name="android.permission.read_phone_state"/>

5、结果截图：

Android基于讯飞语音SDK实现语音识别

以上就是本文的全部内容了，希望小伙伴们能够喜欢。

上一篇： AOP添加操作日志

下一篇： SpringBoot 使用jwt进行身份验证的方法示例

Android基于讯飞语音SDK实现语音识别