Не получается точный вывод текста, извлеченного из отсканированного изображения (для преобразования отсканированного PDF / изображения в текст) в Python - PullRequest
0 голосов
/ 05 апреля 2019

«Не получается точный вывод текста, извлеченного из отсканированного изображения (для преобразования отсканированного pdf / изображения в текст) в Python»

Это код, который я пробовал, который не дает точного результата:

img = PIL.Image.open ("r.jpeg") arr = numpy.array (img) print (arr)

cv2.imshow ("output", arr) cv2.imwrite ('Output Image.jpg', arr) cv2.waitKey (0)

output = pytesseract.image_to_string (PIL.Image.open ("Output Image.PNG"). Convert ("RGB"), lang ='eng') печать (вывод) [введите описание изображения здесь]

Это отсканированное изображение 'r.jpg * 1

...