Android中使用orc实现文字识别实例
一、什么是orc?
引用百度百科的介绍,指利用光学字符识别(orc全称:optical character recognition)技术,将图片、照片上的文字内容,直接转换为可编辑文本,支持jpg、png、gif、bmp、doc等图片格式。简单一句话,就是可以把图片上的文字识别出来。应用的场景有很多,比如说:身份证号码识别,银行卡号识别等等。
二、效果展示
这里笔者实现的仅仅是一个效果,实际使用可能需要对它进行训练以提高识别率,第一次做gif图片,效果不是很好
三、开始集成
github上面已经提供了android端的工具api,github地址:
集成流2
1.下载中文简体语言包
2.导入依赖
3.api的使用,获取tessbaseapi mbaseapi = new tessbaseapi();实例
4.api的使用,初始化tessbaseapi设置,设置识别的语言和语言包所在文件路径 mbaseapi.init(path + file.separator, "chi_sim");
5.api的使用,设置bitmap,mbaseapi.setimage(bitmap);
6.api的使用,从bitmap获取文字信息,mbaseapi.getutf8text();
1.下载中文简体语言包
找到tessdata——>chi_sim.traineddata
下载好了之后,需要放到sd卡中,目录不限,但是必须要放在tessdata目录里面,如果没有tessdata目录需要手动创建,例如我是demo中是放在sd卡根目录中,就直接在sd卡根目录创建tessdata目录,然后把下载好的chi_sim.traineddata语言包丢进去,实际项目中,在识别时候最好坐下语言包是否复制到位的检查,以免出现异常。demo中仅仅是检查了是否创建tessdata目录,这里实际上仍然存在风险的。
2.导入依赖
gradle方式添加:
3.mainactivity代码
public class mainactivity extends appcompatactivity implements view.onclicklistener { private textview mtvinfo; private tessbaseapi mbaseapi; private progressbar mprobar; private string path; private radiogroup mradiogroup; private radiobutton mrbtnidcard; private radiobutton mrbtnbanknumber; private radiobutton mrbtntxt; @override protected void oncreate(bundle savedinstancestate) { super.oncreate(savedinstancestate); setcontentview(r.layout.activity_main); findviewbyid(r.id.btn_start).setonclicklistener(this); mprobar = (progressbar) findviewbyid(r.id.pb); mtvinfo = (textview) findviewbyid(r.id.tv_info); mradiogroup = (radiogroup) findviewbyid(r.id.rg); mrbtnidcard = (radiobutton) findviewbyid(r.id.rb_idcard); mrbtnbanknumber = (radiobutton) findviewbyid(r.id.rb_banknumber); mrbtntxt = (radiobutton) findviewbyid(r.id.rb_txt); mradiogroup.check(0); path = environment.getexternalstoragedirectory().getabsolutefile().getabsolutepath(); } @override public void onclick(view v) { mtvinfo.settext(""); switch (v.getid()) { case r.id.btn_start: if (build.version.sdk_int >= 23) { if (activitycompat.checkselfpermission(this, manifest.permission.write_external_storage) != packagemanager.permission_granted) { // 没有权限 if(activitycompat.shouldshowrequestpermissionrationale(this, manifest.permission.call_phone)){ //如果没勾选“不再询问”,向用户发起权限请求 activitycompat.requestpermissions(this, new string[]{manifest.permission.call_phone}, 0); }else{ toast.maketext(this,"请前往设置——>存储卡权限——>允许",toast.length_short).show(); } } else { // 有权限,接着你要干的活 startreadtext(); } }else{ startreadtext(); } break; } } private handler mhandler = new handler() { @override public void handlemessage(message msg) { switch (msg.what) { case 0: string s = (string) msg.obj; if (!textutils.isempty(s)) { mprobar.setvisibility(view.gone); mtvinfo.settext(s); //释放bitmap mbaseapi.clear(); } else { mprobar.setvisibility(view.gone); toast.maketext(mainactivity.this, "识别图片内容失败", toast.length_short).show(); } break; case 1: toast.maketext(mainactivity.this, "读取图片失败", toast.length_short).show(); break; } } }; private bitmap getbitmap(int id) { bitmap bitmap = null; try { bitmap = bitmapfactory.decoderesource(getresources(), id); } catch (exception e) { return null; } return bitmap; } /** * 开始识别文字 */ private void startreadtext() { file f = new file(path+"/tessdata") ; if(!f.exists()){ toast.maketext(this,"请先下载好语言包置于sd/tessdata目录",toast.length_short).show(); return; } final int btnid = mradiogroup.getcheckedradiobuttonid(); final int resid ; if(r.id.rb_idcard==btnid){ resid = r.drawable.idcard; }else if(r.id.rb_banknumber==btnid){ resid = r.drawable.bank_number; }else{ resid = r.drawable.tet_info; } mprobar.setvisibility(view.visible); new thread() { @override public void run() { mbaseapi = new tessbaseapi();//初始化需要耗时,可以启动时程序时,预初始化 mbaseapi.init(path + file.separator, "chi_sim"); bitmap bitmap = getbitmap(resid); if (bitmap == null) { mhandler.sendemptymessage(1); } else { mbaseapi.setimage(bitmap); //根据init的语言,获得ocr后的字符串 string t = mbaseapi.getutf8text();//耗时操作 message obtain = message.obtain(); obtain.what = 0; obtain.obj = t; mhandler.sendmessage(obtain); } } }.start(); } }
4.activity_main.xml代码
<linearlayout xmlns:android="http://schemas.android.com/apk/res/android" xmlns:tools="http://schemas.android.com/tools" android:id="@+id/activity_main" android:layout_width="match_parent" android:layout_height="match_parent" android:orientation="vertical" android:paddingbottom="@dimen/activity_vertical_margin" android:paddingleft="@dimen/activity_horizontal_margin" android:paddingright="@dimen/activity_horizontal_margin" android:paddingtop="@dimen/activity_vertical_margin" tools:context="com.demo.orc.mainactivity"> <radiogroup android:id="@+id/rg" android:orientation="horizontal" android:layout_width="match_parent" android:layout_height="wrap_content"> <radiobutton android:checked="true" android:id="@+id/rb_idcard" android:text="身份证" android:layout_width="wrap_content" android:layout_height="wrap_content" /> <radiobutton android:id="@+id/rb_banknumber" android:text="银行卡" android:layout_width="wrap_content" android:layout_height="wrap_content" /> <radiobutton android:id="@+id/rb_txt" android:text="文字" android:layout_width="wrap_content" android:layout_height="wrap_content" /> </radiogroup> <button android:id="@+id/btn_start" android:layout_width="wrap_content" android:layout_height="wrap_content" android:text="开始识别"/> <textview android:text="识别结果展示区:" android:layout_width="match_parent" android:layout_height="wrap_content" /> <framelayout android:layout_width="match_parent" android:layout_height="match_parent"> <progressbar android:id="@+id/pb" android:layout_width="wrap_content" android:layout_height="wrap_content" android:layout_gravity="center" android:visibility="gone"/> <textview android:id="@+id/tv_info" android:layout_width="match_parent" android:layout_height="match_parent" android:text=""/> </framelayout> </linearlayout>
四、提高识别率
demo识别率其实不是很理想,比如把数字0识别成了字母o等,这是因为我们的根本没有进行样本训练。关于样本的训练,我目前还没实际操作过,因为公司的识别需求更为复杂,这个框架难以达到效果,公司买了第三方的一个识别框架。不过仅仅是实现身份证号,银行卡号,和一些简单的文字信息,用这个框架足以实现。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。