Я использовал tess4j для извлечения текста из изображения, но не получил правильный результат - PullRequest
0 голосов
/ 27 декабря 2018

Я использовал tess4j, но не получил правильный результат.ниже мой код.

 public static String crackImage(String filePath) {


  BufferedImage img = null;
  try {
      img = ImageIO.read(new File(filePath));
  } catch (IOException e) {
  }
    ITesseract instance = new Tesseract();
    instance.setLanguage("eng");
  //  instance.setPageSegMode((3));
 img=  ImageHelper.convertImageToGrayscale(img);
    instance.setDatapath("C:\\tessdata");

    try {
        String result = instance.doOCR(img);
        return result;
    } catch (TesseractException e) {
        System.err.println(e.getMessage());
        return "Error while reading image";
    }
}

Я приложил образец изображения.

Smaple Image

МОЙ выход:

рука м манера: а;человек

м fl / Вмм 1951 мм 8221 11м 3521 | \ | \ | II \ IIIIIIHIIIIIHIIIH

мразь — WWW

% '

Пожалуйста, укажите, как можноЯ получаю правильный результат

1 Ответ

0 голосов
/ 27 декабря 2018

- это лучший метод,

, который вам необходимо выполнить, обработку изображений предпочитайте использовать (OpenCV) перед выполнением этой команды tess4j.https://github.com/tesseract-ocr/tesseract/wiki/ImproveQuality

или вы можете выбрать Google Ml KIT

https://firebase.google.com/docs/ml-kit/recognize-text

...