Лучшие практики для Tesseract OCR с использованием Python - PullRequest
1 голос
/ 15 октября 2019

Я работаю над проектом, в котором я хочу распознать текст из документа размером с кредитную карту. Документ содержит такие данные, как имя, номер телефона, адрес и т. Д. Я снимаю изображение и передаю его в движок tesseract. используя text = pytesseract.image_to_string(Image.open(filename), lang = 'eng'). Иногда я получаю приличные результаты для каждого поля, но в большинстве случаев результат очень плохой. Как мне решить эту проблему? Каковы лучшие практики. Как читатели документов работают с OCR. Можно ли обрабатывать в документе ocr на основе региона?

1 Ответ

0 голосов
/ 15 октября 2019

Один подход не может прочитать каждый текст. Вы должны применить несколько подходов для нескольких типов PDF.

Если текст не является горизонтальным, вы должны повернуть текст. Если текст искривлен, вы должны использовать преобразование (например, hog transform).

Кроме того, для чтения текста с использованием пакета тексты должны быть четкими и горизонтальными. В противном случае вам нужно создать правила и трансформировать их.

...