«Не получается точный вывод текста, извлеченного из отсканированного изображения (для преобразования отсканированного pdf / изображения в текст) в Python»
Это код, который я пробовал, который не дает точного результата:
img = PIL.Image.open ("r.jpeg") arr = numpy.array (img) print (arr)
cv2.imshow ("output", arr) cv2.imwrite ('Output Image.jpg', arr) cv2.waitKey (0)
output = pytesseract.image_to_string (PIL.Image.open ("Output Image.PNG"). Convert ("RGB"), lang ='eng') печать (вывод) [введите описание изображения здесь]
Это отсканированное изображение 'r.jpg * 1