выделение текста отдельно при извлечении из изображения - PullRequest
0 голосов
/ 18 октября 2019

Как выделить каждый отдельный текст, извлеченный из изображения отдельно.

Я предоставил код для преобразования изображения в текстовый файл, где tesseract используется в качестве технологии оптического распознавания символов.

   public class Sample{ 
        public static void main(String[] args) 
        { 
            Tesseract tesseract = new Tesseract(); 
            try { 

                tesseract.setDatapath("D:/Tess4J/tessdata"); 

                String text 
                    = tesseract.doOCR(new File("image.jpg")); 

                System.out.print(text); 
            } 
            catch (TesseractException e) { 
                e.printStackTrace(); 
            } 
        }

1 Ответ

0 голосов
/ 18 октября 2019

Я не совсем уверен, что вы подразумеваете под "отдельным текстом, извлеченным из изображения отдельно". Но я угадаю. Если вы хотите разделить текст, который вы получаете из изображения, используйте следующее:

text.split("some symbol");

Затем вы можете добавить части в массив и раскрасить каждую часть, используя коды ANSI:

String[] array = text.split("some symbol");
for(int i=0; i<array.length; i++){
 System.out.print(ANSI_CODE+array[0]);
}

Эта запись Как напечатать цвет в консоли с помощью System.out.println? поможет вам выбрать код

...