Может ли tesseract вернуть N / A или что-то сопоставимое для пустых зон? - PullRequest
0 голосов
/ 06 июля 2019

Я настраиваю автоматический конвейер для записи данных из PDF-форм, чтобы они сохранялись в базе данных SQL с использованием tesseract и python.Я настроил файлы tesseract UZN для просмотра определенных областей моих документов, однако бывают случаи, когда в этих регионах нет текста.

Возможно ли сделать так, чтобы tesseract делал это?Даже если мне придется возиться с источником Тессеракта?

Пока просто настраиваю файл зоны.Я также использовал preserve_interword_spaces = 1 и не получаю пустых строк для этих регионов.

Я немного покопался здесь, но без особой удачи.

...