欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  移动技术

Android中使用orc实现文字识别实例

程序员文章站 2024-02-11 09:37:58
一、什么是orc? 引用百度百科的介绍,指利用光学字符识别(orc全称:optical character recognition)技术,将图片、照片上的文字内容...

一、什么是orc?

引用百度百科的介绍,指利用光学字符识别(orc全称:optical character recognition)技术,将图片、照片上的文字内容,直接转换为可编辑文本,支持jpg、png、gif、bmp、doc等图片格式。简单一句话,就是可以把图片上的文字识别出来。应用的场景有很多,比如说:身份证号码识别,银行卡号识别等等。

二、效果展示

这里笔者实现的仅仅是一个效果,实际使用可能需要对它进行训练以提高识别率,第一次做gif图片,效果不是很好

Android中使用orc实现文字识别实例

Android中使用orc实现文字识别实例

Android中使用orc实现文字识别实例

三、开始集成

github上面已经提供了android端的工具api,github地址:

集成流2

1.下载中文简体语言包

2.导入依赖

3.api的使用,获取tessbaseapi mbaseapi = new tessbaseapi();实例

4.api的使用,初始化tessbaseapi设置,设置识别的语言和语言包所在文件路径 mbaseapi.init(path + file.separator, "chi_sim");

5.api的使用,设置bitmap,mbaseapi.setimage(bitmap);

6.api的使用,从bitmap获取文字信息,mbaseapi.getutf8text();

1.下载中文简体语言包


找到tessdata——>chi_sim.traineddata

下载好了之后,需要放到sd卡中,目录不限,但是必须要放在tessdata目录里面,如果没有tessdata目录需要手动创建,例如我是demo中是放在sd卡根目录中,就直接在sd卡根目录创建tessdata目录,然后把下载好的chi_sim.traineddata语言包丢进去,实际项目中,在识别时候最好坐下语言包是否复制到位的检查,以免出现异常。demo中仅仅是检查了是否创建tessdata目录,这里实际上仍然存在风险的。

2.导入依赖

gradle方式添加:

3.mainactivity代码

public class mainactivity extends appcompatactivity implements view.onclicklistener {

private textview mtvinfo;
private tessbaseapi mbaseapi;
private progressbar mprobar;
private string path;
private radiogroup mradiogroup;
private radiobutton mrbtnidcard;
private radiobutton mrbtnbanknumber;
private radiobutton mrbtntxt;

@override
protected void oncreate(bundle savedinstancestate) {
  super.oncreate(savedinstancestate);
  setcontentview(r.layout.activity_main);
  findviewbyid(r.id.btn_start).setonclicklistener(this);
  mprobar = (progressbar) findviewbyid(r.id.pb);
  mtvinfo = (textview) findviewbyid(r.id.tv_info);
  mradiogroup = (radiogroup) findviewbyid(r.id.rg);
  mrbtnidcard = (radiobutton) findviewbyid(r.id.rb_idcard);
  mrbtnbanknumber = (radiobutton) findviewbyid(r.id.rb_banknumber);
  mrbtntxt = (radiobutton) findviewbyid(r.id.rb_txt);
  mradiogroup.check(0);

  path = environment.getexternalstoragedirectory().getabsolutefile().getabsolutepath();
}

@override
public void onclick(view v) {
  mtvinfo.settext("");
  switch (v.getid()) {
    case r.id.btn_start:
      if (build.version.sdk_int >= 23) {
        if (activitycompat.checkselfpermission(this, manifest.permission.write_external_storage) != packagemanager.permission_granted) {
          // 没有权限
          if(activitycompat.shouldshowrequestpermissionrationale(this, manifest.permission.call_phone)){
            //如果没勾选“不再询问”,向用户发起权限请求
            activitycompat.requestpermissions(this, new string[]{manifest.permission.call_phone}, 0);
          }else{
            toast.maketext(this,"请前往设置——>存储卡权限——>允许",toast.length_short).show();
          }
        } else {
          // 有权限,接着你要干的活
          startreadtext();
        }
      }else{
        startreadtext();
      }
      break;
  }
}


private handler mhandler = new handler() {
  @override
  public void handlemessage(message msg) {
    switch (msg.what) {
      case 0:
        string s = (string) msg.obj;
        if (!textutils.isempty(s)) {
          mprobar.setvisibility(view.gone);
          mtvinfo.settext(s);
          //释放bitmap
          mbaseapi.clear();
        } else {
          mprobar.setvisibility(view.gone);
          toast.maketext(mainactivity.this, "识别图片内容失败", toast.length_short).show();
        }

        break;
      case 1:
        toast.maketext(mainactivity.this, "读取图片失败", toast.length_short).show();
        break;
    }
  }
};

private bitmap getbitmap(int id) {
  bitmap bitmap = null;
  try {
    bitmap = bitmapfactory.decoderesource(getresources(), id);
  } catch (exception e) {
    return null;
  }
  return bitmap;
}

/**
 * 开始识别文字
 */
private void startreadtext() {

  file f = new file(path+"/tessdata") ;
  if(!f.exists()){
    toast.maketext(this,"请先下载好语言包置于sd/tessdata目录",toast.length_short).show();
    return;
  }

  final int btnid = mradiogroup.getcheckedradiobuttonid();
  final int resid ;
  if(r.id.rb_idcard==btnid){
    resid = r.drawable.idcard;
  }else if(r.id.rb_banknumber==btnid){
    resid = r.drawable.bank_number;
  }else{
    resid = r.drawable.tet_info;
  }

  mprobar.setvisibility(view.visible);
  new thread() {
    @override
    public void run() {
      mbaseapi = new tessbaseapi();//初始化需要耗时,可以启动时程序时,预初始化
      mbaseapi.init(path + file.separator, "chi_sim");
      bitmap bitmap = getbitmap(resid);
      if (bitmap == null) {
        mhandler.sendemptymessage(1);
      } else {
        mbaseapi.setimage(bitmap);
        //根据init的语言,获得ocr后的字符串
        string t = mbaseapi.getutf8text();//耗时操作
        message obtain = message.obtain();
        obtain.what = 0;
        obtain.obj = t;
        mhandler.sendmessage(obtain);
      }
    }
  }.start();
}
}

4.activity_main.xml代码

<linearlayout
xmlns:android="http://schemas.android.com/apk/res/android"
xmlns:tools="http://schemas.android.com/tools"
android:id="@+id/activity_main"
android:layout_width="match_parent"
android:layout_height="match_parent"
android:orientation="vertical"
android:paddingbottom="@dimen/activity_vertical_margin"
android:paddingleft="@dimen/activity_horizontal_margin"
android:paddingright="@dimen/activity_horizontal_margin"
android:paddingtop="@dimen/activity_vertical_margin"
tools:context="com.demo.orc.mainactivity">

<radiogroup
  android:id="@+id/rg"
  android:orientation="horizontal"
  android:layout_width="match_parent"
  android:layout_height="wrap_content">

  <radiobutton
    android:checked="true"
    android:id="@+id/rb_idcard"
    android:text="身份证"
    android:layout_width="wrap_content"
    android:layout_height="wrap_content" />
  <radiobutton
    android:id="@+id/rb_banknumber"
    android:text="银行卡"
    android:layout_width="wrap_content"
    android:layout_height="wrap_content" />
  <radiobutton
    android:id="@+id/rb_txt"
    android:text="文字"
    android:layout_width="wrap_content"
    android:layout_height="wrap_content" />

</radiogroup>


<button
  android:id="@+id/btn_start"
  android:layout_width="wrap_content"
  android:layout_height="wrap_content"
  android:text="开始识别"/>

<textview
  android:text="识别结果展示区:"
  android:layout_width="match_parent"
  android:layout_height="wrap_content" />

<framelayout
  android:layout_width="match_parent"
  android:layout_height="match_parent">

  <progressbar
    android:id="@+id/pb"
    android:layout_width="wrap_content"
    android:layout_height="wrap_content"
    android:layout_gravity="center"
    android:visibility="gone"/>

  <textview
    android:id="@+id/tv_info"
    android:layout_width="match_parent"
    android:layout_height="match_parent"
    android:text=""/>

</framelayout>
</linearlayout>

四、提高识别率

demo识别率其实不是很理想,比如把数字0识别成了字母o等,这是因为我们的根本没有进行样本训练。关于样本的训练,我目前还没实际操作过,因为公司的识别需求更为复杂,这个框架难以达到效果,公司买了第三方的一个识别框架。不过仅仅是实现身份证号,银行卡号,和一些简单的文字信息,用这个框架足以实现。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。