ETJava Beta | Java    注册   登录
  • Tess4J解析图片文字 1

    发表于 2024-05-19 22:03:29     阅读(196)     博客类别:J2SE

    Tess4J解析图片文字 1

     

    添加依赖

    <dependency>
                <groupId>net.sourceforge.tess4j</groupId>
                <artifactId>tess4j</artifactId>
                <version>5.6.0</version>
            </dependency>

    下载语言库

    链接:https://pan.baidu.com/s/15WMD6A-x6hli4smtJ9i8FQ?pwd=1234 
    提取码:1234

    将语言库解压缩到某个盘符下 然后程序中指定语言库位置即可

    测试案例

    import net.sourceforge.tess4j.Tesseract;
    import net.sourceforge.tess4j.TesseractException;
    
    import java.io.File;
    
    public class OCRExample {
        public static void main(String[] args) {
            Tesseract tesseract = new Tesseract();
            
            try {
                // 设置tesseract的语言库路径
                tesseract.setDatapath("D:/tessdata");
    
                // 设置识别语言,默认为英文,中文简体设置为"chi_sim"
    //            tesseract.setLanguage("eng"); // 英文
                tesseract.setLanguage("chi_sim");
    
                // 读取图片文件
                String result = tesseract.doOCR(new File("D:/d.png"));
                System.out.println(result);
            } catch (TesseractException e) {
                e.printStackTrace();
            }
        }
    }

    测试图片

    测试结果

     

    完整demo下载

    链接:https://pan.baidu.com/s/15WZg2nnFO-mar7856KfSdg?pwd=1234 
    提取码:1234