欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

java 调用tess4j 识别图片

程序员文章站 2022-07-06 10:40:57
...

Tess4J是对Tesseract OCR .的Java JNA 封装,  Tesseract 是开源的oci 框架,可以使用不同的语言进行调用,github 地址是https://github.com/tesseract-ocr。java 的调用方式。

1、导入依赖到pom.xm

<dependency>
    <groupId>net.sourceforge.tess4j</groupId>
    <artifactId>tess4j</artifactId>
    <version>4.5.1</version>
</dependency>

2、访问https://github.com/tesseract-ocr/tessdata  把需要的训练数据下载到目录下面,我这里面说放到resouces目录下面。我下载了eng.traineddata 和chi_sim.traineddata 、。


    public static void  ocrTest(String dataPath){

        // 识别图片的路径(修改为自己的图片路径)
        String path = "C:\\Users\\gst\\Desktop\\aaa.png";
        File file = new File(path);

        ITesseract instance = new Tesseract();
        instance.setDatapath(dataPath);
        instance.setLanguage("chi_sim");

        String result = null;
        try {
            long startTime = System.currentTimeMillis();
            result =  instance.doOCR(file);
            long endTime = System.currentTimeMillis();
            System.out.println("Time is:" + (endTime - startTime) + " 毫秒");
        } catch (TesseractException e) {
            e.printStackTrace();
        }

        System.out.println("result: ");
        System.out.println(result);
    }

    public static void main(String[] args) {

//        System.out.println(Test.class.getClass().getResource("/"));

        ocrTest( Test.class.getClass().getResource("/").getPath().substring(1));

    }

java 调用tess4j 识别图片

相关标签: JAVA java