Question

Я настраиваю автоматический конвейер для записи данных из PDF-форм, чтобы они сохранялись в базе данных SQL с использованием tesseract и python.Я настроил файлы tesseract UZN для просмотра определенных областей моих документов, однако бывают случаи, когда в этих регионах нет текста.

Возможно ли сделать так, чтобы tesseract делал это?Даже если мне придется возиться с источником Тессеракта?

Пока просто настраиваю файл зоны.Я также использовал preserve_interword_spaces = 1 и не получаю пустых строк для этих регионов.

Я немного покопался здесь, но без особой удачи.

Может ли tesseract вернуть N / A или что-то сопоставимое для пустых зон?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Может ли tesseract вернуть N / A или что-то сопоставимое для пустых зон?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы