Tesseract in Java - Intellij IDEA对Tess4J的配置和使用
程序员文章站
2022-07-05 21:55:50
...
最近要弄OCR,按照官方的一步步来,外网慢的很,一些要下的我已经传到csdn给大家下载。
官网:http://tess4j.sourceforge.net/codesample.html
中文训练库下载地址:
http://download.csdn.net/detail/d_dmelon/9916532
其他语言库:
https://github.com/tesseract-ocr/tessdata
Tess4J3.4下载地址:
http://download.csdn.net/detail/d_dmelon/9916519
安装Visual C++ 2015 Redistributable Packages(官网:The Windows native libraries were built with VS2015 and therefore depend on the Visual C++ 2015 Redistributable Packages.)
http://download.csdn.net/detail/d_dmelon/9916663
环境: JDK1.8 Intellij IDEA
解压Tess4J 3.4.zip文件,拷贝dist目录下的jar文件到IDEA的工程目录(我是新建了一个libs文件夹),拷贝tessdata文件夹到项目工程下(与src文件夹同级),在把中文训练库chi_sim拷贝到这个tessdata文件夹里。
(如果不行的话,使用IDEA-Project Structure-Libraries-绿色加号add,把解压目录的lib路径添加进去编译,我反正根据上述步骤就行了)
demo
package net.sourceforge.tess4j.example;
import java.io.File;
import net.sourceforge.tess4j.*;
public class TesseractExample {
public static void main(String[] args) {
File imageFile = new File("<图片地址>");
ITesseract instance = new Tesseract();
instance.setLanguage("chi_sim");
try {
String result = instance.doOCR(imageFile);
System.out.println(result);
} catch (TesseractException e) {
System.err.println(e.getMessage());
}
}
}