Question

Я пытаюсь извлечь текст из изображения, используя tesseract-ocr.

Результат с первого изображения:

Теперь это прекрасно работает на этом.

Результат со второго изображения:

try:
    from PIL import Image
except ImportError:
    import Image
import pytesseract


print(pytesseract.image_to_string(Image.open('input.png')))

Но не удается прочитать текстс первого изображения.Я показал результаты из первого изображения и второго изображения.Единственное отличие, которое я могу заметить между этими двумя изображениями, - это поле, в которое помещается все первое изображение.

Я также сделал это с помощью pdf-miner.Тот же результат сохраняется.Я не могу понять, что именно происходит.В чем может быть причина?

Rick M. · Answer 1 · 14 февраля 2019

Тессеракт работает лучше всего, когда у нас чистый черный текст на сплошном белом фоне.Это также хорошо работает, когда текст приблизительно горизонтальный, а высота текста не менее 20 пикселей, но я видел, что он работает и с вертикальными текстами.

Если текст имеет окружающую границу, он может быть обнаружен как некоторый случайный текст, как в вашем случае на первом изображении.Вы можете обрезать границу или использовать алгоритмы обнаружения текста перед выполнением тессеракта.

Алгоритмы обнаружения текста в OpenCV:

Определение текста сцены

Еще один замечательный учебник

Извлечение текста из изображения

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Извлечение текста из изображения

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов