Я делаю преобразование тессеракта в файл изображений. Вот код, используемый для извлечения текста из изображений:
#Extract text from Image
im = Image.open(r"C:\Users\XXXXX")
text = pytesseract.image_to_string(im, lang = 'eng',config='--psm 1 --oem 3')
print(text)
Но при этом я получаю некоторые ошибки в выводе. Некоторые примеры - потеря пространства и неправильное преобразование.
I am -> Iam
I -> |
Не могли бы вы посоветовать, как исправить эти ошибки?