java 调用tess4j 识别图片
程序员文章站
2022-07-06 10:40:57
...
Tess4J是对Tesseract OCR .的Java JNA 封装, Tesseract 是开源的oci 框架,可以使用不同的语言进行调用,github 地址是https://github.com/tesseract-ocr。java 的调用方式。
1、导入依赖到pom.xm
<dependency> <groupId>net.sourceforge.tess4j</groupId> <artifactId>tess4j</artifactId> <version>4.5.1</version> </dependency>
2、访问https://github.com/tesseract-ocr/tessdata 把需要的训练数据下载到目录下面,我这里面说放到resouces目录下面。我下载了eng.traineddata 和chi_sim.traineddata 、。
public static void ocrTest(String dataPath){
// 识别图片的路径(修改为自己的图片路径)
String path = "C:\\Users\\gst\\Desktop\\aaa.png";
File file = new File(path);
ITesseract instance = new Tesseract();
instance.setDatapath(dataPath);
instance.setLanguage("chi_sim");
String result = null;
try {
long startTime = System.currentTimeMillis();
result = instance.doOCR(file);
long endTime = System.currentTimeMillis();
System.out.println("Time is:" + (endTime - startTime) + " 毫秒");
} catch (TesseractException e) {
e.printStackTrace();
}
System.out.println("result: ");
System.out.println(result);
}
public static void main(String[] args) {
// System.out.println(Test.class.getClass().getResource("/"));
ocrTest( Test.class.getClass().getResource("/").getPath().substring(1));
}
上一篇: 回帖的理由~经典~
下一篇: Oracle递归树形结构查询功能