Извлечение текста из изображения - PullRequest
0 голосов
/ 14 февраля 2019

Я пытаюсь извлечь текст из изображения, используя tesseract-ocr.image

Результат с первого изображения:

result1

Теперь это прекрасно работает на этом.imag

Результат со второго изображения:

enter image description here

try:
    from PIL import Image
except ImportError:
    import Image
import pytesseract


print(pytesseract.image_to_string(Image.open('input.png')))

Но не удается прочитать текстс первого изображения.Я показал результаты из первого изображения и второго изображения.Единственное отличие, которое я могу заметить между этими двумя изображениями, - это поле, в которое помещается все первое изображение.

Я также сделал это с помощью pdf-miner.Тот же результат сохраняется.Я не могу понять, что именно происходит.В чем может быть причина?

1 Ответ

0 голосов
/ 14 февраля 2019

Тессеракт работает лучше всего, когда у нас чистый черный текст на сплошном белом фоне.Это также хорошо работает, когда текст приблизительно горизонтальный, а высота текста не менее 20 пикселей, но я видел, что он работает и с вертикальными текстами.

Если текст имеет окружающую границу, он может быть обнаружен как некоторый случайный текст, как в вашем случае на первом изображении.Вы можете обрезать границу или использовать алгоритмы обнаружения текста перед выполнением тессеракта.

Алгоритмы обнаружения текста в OpenCV:

Определение текста сцены

Еще один замечательный учебник

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...