android 端拍照并运用Tesseract OCR 识别图片中字符
程序员文章站
2023-12-30 10:52:16
...
借鉴了一篇博客:
http://my.oschina.net/yushulx/blog/359468#OSC_h3_4
英文版在这里:
http://www.codepool.biz/making-an-android-ocr-application-with-tesseract.html
我上传了一个android studio环境下的例子,可以拍照或者选择图库中图片进行识别。
这个链接(https://github.com/yuzhiyun/TesseractOCR2/)包括一份工程源代码和 两个压缩包(语言包),一个是中文汉字,一个是英文。
请注意:
必须现在手机内部存储根目录
(在程序中获取这个字符串就明白这个目录是什么了Environment.getExternalStorageDirectory())
下新建一个文件夹tessdata,然后把语言包解压后放进这个目录,如果没有语言包,程序会崩溃。
程序并不是特别精确,因为是直接识别的,没有对图片进行处理,我会在稍后的博客里讲述如何处理图片(比图锐化等)以提高精确度。