Я настраиваю автоматический конвейер для записи данных из PDF-форм, чтобы они сохранялись в базе данных SQL с использованием tesseract и python.Я настроил файлы tesseract UZN для просмотра определенных областей моих документов, однако бывают случаи, когда в этих регионах нет текста.
Возможно ли сделать так, чтобы tesseract делал это?Даже если мне придется возиться с источником Тессеракта?
Пока просто настраиваю файл зоны.Я также использовал preserve_interword_spaces = 1
и не получаю пустых строк для этих регионов.
Я немного покопался здесь, но без особой удачи.