欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Tesseract in Java - Intellij IDEA对Tess4J的配置和使用

程序员文章站 2022-07-05 21:55:50
...

最近要弄OCR,按照官方的一步步来,外网慢的很,一些要下的我已经传到csdn给大家下载。

官网:http://tess4j.sourceforge.net/codesample.html

中文训练库下载地址:
http://download.csdn.net/detail/d_dmelon/9916532
其他语言库:
https://github.com/tesseract-ocr/tessdata

Tess4J3.4下载地址:
http://download.csdn.net/detail/d_dmelon/9916519

安装Visual C++ 2015 Redistributable Packages(官网:The Windows native libraries were built with VS2015 and therefore depend on the Visual C++ 2015 Redistributable Packages.)
http://download.csdn.net/detail/d_dmelon/9916663

环境: JDK1.8 Intellij IDEA
解压Tess4J 3.4.zip文件,拷贝dist目录下的jar文件到IDEA的工程目录(我是新建了一个libs文件夹),拷贝tessdata文件夹到项目工程下(与src文件夹同级),在把中文训练库chi_sim拷贝到这个tessdata文件夹里。

(如果不行的话,使用IDEA-Project Structure-Libraries-绿色加号add,把解压目录的lib路径添加进去编译,我反正根据上述步骤就行了)
demo

package net.sourceforge.tess4j.example;

import java.io.File;
import net.sourceforge.tess4j.*;

public class TesseractExample {

    public static void main(String[] args) {
        File imageFile = new File("<图片地址>");
        ITesseract instance = new Tesseract();  
        instance.setLanguage("chi_sim");
        try {
            String result = instance.doOCR(imageFile);
            System.out.println(result);
        } catch (TesseractException e) {
            System.err.println(e.getMessage());
        }
    }
}