Tess4J识别图片
程序员文章站
2022-03-05 10:21:47
...
Tess4j下载地址 https://sourceforge.net/projects/tess4j/
需要的包:解压后dist文件夹中tess4j-3.4.8.jar与lib文件夹中所有的jar包构建路径
压缩包中只有英文字符集 可以在 此链接 https://github.com/tesseract-ocr/tessdata 中下载chi_sim.traineddata中文简体字符集
在与src同等级新建一个tessdata文件夹,将字符集放入
import java.io.File;
import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;
public class MyOCR {
public String ocr(File s) throws TesseractException {
ITesseract instance = new Tesseract();
instance.setDatapath("");
instance.setLanguage("chi_sim");
if(s!=null) {
String x=instance.doOCR(s);
return x;
}
else
return "";
}
public static void main(String[] args) {
MyOCR myOCR=new MyOCR();
try {
System.out.println(myOCR.ocr(new File(图片路径)));
} catch (TesseractException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}