欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Tess4J识别图片

程序员文章站 2022-03-05 10:21:47
...

Tess4j下载地址     https://sourceforge.net/projects/tess4j/

需要的包:解压后dist文件夹中tess4j-3.4.8.jar与lib文件夹中所有的jar包构建路径

压缩包中只有英文字符集  可以在 此链接  https://github.com/tesseract-ocr/tessdata  中下载chi_sim.traineddata中文简体字符集

在与src同等级新建一个tessdata文件夹,将字符集放入

 

import java.io.File;
import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;
public class MyOCR {
    public String ocr(File s) throws TesseractException {  
        ITesseract instance = new Tesseract(); 
        instance.setDatapath("");
        instance.setLanguage("chi_sim");
        if(s!=null) {
        	String x=instance.doOCR(s);
        	return x;
        }
        else
        return "";
    }  
    public static void main(String[] args) {
    	MyOCR myOCR=new MyOCR();
    	try {
			System.out.println(myOCR.ocr(new File(图片路径)));
		} catch (TesseractException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
    }  
}  

 

相关标签: Ťess4j ØCR