Question

Я работаю над проектом, в котором я хочу распознать текст из документа размером с кредитную карту. Документ содержит такие данные, как имя, номер телефона, адрес и т. Д. Я снимаю изображение и передаю его в движок tesseract. используя text = pytesseract.image_to_string(Image.open(filename), lang = 'eng'). Иногда я получаю приличные результаты для каждого поля, но в большинстве случаев результат очень плохой. Как мне решить эту проблему? Каковы лучшие практики. Как читатели документов работают с OCR. Можно ли обрабатывать в документе ocr на основе региона?

Kallol Samanta · Answer 1 · 15 октября 2019

Один подход не может прочитать каждый текст. Вы должны применить несколько подходов для нескольких типов PDF.

Если текст не является горизонтальным, вы должны повернуть текст. Если текст искривлен, вы должны использовать преобразование (например, hog transform).

Кроме того, для чтения текста с использованием пакета тексты должны быть четкими и горизонтальными. В противном случае вам нужно создать правила и трансформировать их.

Лучшие практики для Tesseract OCR с использованием Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Лучшие практики для Tesseract OCR с использованием Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы