Я использую tess4j 4.3.0 в моем недавнем проекте. Я пытаюсь получить текст из изображений TIF / BufferedImages. Когда я хочу извлечь текст, эта ошибка возникает на четвертой картинке, которую я хочу извлечь.
Я уже пытался изменить локали. При какой-то конфигурации он запускал около 200 изображений, но потом потерпел крах.
Мой код:
public String getContentFromFile()` {
try {
ITesseract instance = new Tesseract();
instance.setDatapath("tessdata");
instance.setLanguage("eng");
String result = instance.doOCR(image);
this.content = result;
return result;
}
catch (Exception e) {
System.err.println(e.getMessage());
this.content = e.getMessage();
return "";
}
}
Ошибка:
содержит_unichar_id (unichar_id): ошибка: ошибка подтверждения: в файле ../ccutil/unicharset.h, строка 513