Я пытаюсь извлечь текст из изображения, используя tesseract-ocr.
Результат с первого изображения:
Теперь это прекрасно работает на этом.
Результат со второго изображения:
try:
from PIL import Image
except ImportError:
import Image
import pytesseract
print(pytesseract.image_to_string(Image.open('input.png')))
Но не удается прочитать текстс первого изображения.Я показал результаты из первого изображения и второго изображения.Единственное отличие, которое я могу заметить между этими двумя изображениями, - это поле, в которое помещается все первое изображение.
Я также сделал это с помощью pdf-miner.Тот же результат сохраняется.Я не могу понять, что именно происходит.В чем может быть причина?