Как извлечь конкретный текст из изображения - PullRequest
0 голосов
/ 15 ноября 2018

Из следующего изображения я хочу извлечь число под текстом Arzt-Nr (654321161).
Я использовал OCR Reader, но он извлекает тексты случайным образом, а не последовательно, что затрудняет добавление логики для извлечения не ниже «Arzt-Nr».

Я использовал следующий код, но тексты не в последовательности.
Есть ли способ добиться этого?

 String text = "";
            for (int i = 0; i < detectedItems.size(); i++) {
                TextBlock item = detectedItems.valueAt(i);
                String detectedText = item.getValue();
                List<Line> lines = (List<Line>) item.getComponents();
                for (Line line : lines) {
                    List<Element> elements = (List<Element>) line.getComponents();
                    for (Element element : elements) {
                        String word = element.getValue();
                        text = text + " " + word;

                    }
                    text += "\n";
                }
            }

enter image description here

Ответы [ 2 ]

0 голосов
/ 16 ноября 2018

Извлеките вывод изображения в формате tsv, используя tesseract, и найдите ближайший текст под местоположением ключевого слова. Также ознакомьтесь с режимами сегментации страниц в tesseract.

Ссылка на Генерация ЦВ Ссылка на использование сегментация страницы

0 голосов
/ 15 ноября 2018

Попробуйте проверить фиксированную длину слов после позиции "Arzt-Nr", попробуйте также проверить шаблон найденного слова .. например, если вам нужны только цифры ecc ...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...