Я делаю преобразование тессеракта в файл изображений. Вот код, используемый для извлечения текста из изображений:
#Extract text from Image
im = Image.open(r"C:\Users\XXXXX")
text = pytesseract.image_to_string(im, lang = 'eng',config='--psm 1 --oem 3')
print(text)
Но при этом я получаю некоторые ошибки в выводе. Некоторые примеры - потеря пространства и неправильное преобразование.
I am -> Iam
I -> |
Не могли бы вы посоветовать, как исправить эти ошибки?
![Image to convert in text](https://i.stack.imgur.com/F5tut.png)