Как я могу поймать или исправить ошибку unichar в tess4j? - PullRequest
0 голосов
/ 05 июля 2019

Я использую tess4j 4.3.0 в моем недавнем проекте. Я пытаюсь получить текст из изображений TIF / BufferedImages. Когда я хочу извлечь текст, эта ошибка возникает на четвертой картинке, которую я хочу извлечь.

Я уже пытался изменить локали. При какой-то конфигурации он запускал около 200 изображений, но потом потерпел крах.

Мой код:

public String getContentFromFile()` {

try {
 ITesseract instance = new Tesseract(); 
 instance.setDatapath("tessdata"); 
 instance.setLanguage("eng");
 String result = instance.doOCR(image);
 this.content = result;
 return result;
}  

catch (Exception e) {
        System.err.println(e.getMessage());
        this.content = e.getMessage();
        return "";
    }
}

Ошибка:

содержит_unichar_id (unichar_id): ошибка: ошибка подтверждения: в файле ../ccutil/unicharset.h, строка 513

...