Ошибка кодирования при печати вывода тессеракта - PullRequest
0 голосов
/ 28 февраля 2019

Я просто пытаюсь сделать простую программу для OCR всей страницы, однако я получаю ошибку кодирования, которая у меня всегда была проблема с исправлением.

Мой код:

from PIL import Image
import pytesseract

text = pytesseract.image_to_string(Image.open('005.png'))
print(text)

Моя ошибка:

Файл "c: / Users / Dylan C / Desktop / Comparitor / image.py", строка 4, в печатном виде (текст)

Файл "C: \ Users \ Dylan C \ AppData \ Local \ Programs \ Python \ Python35 \ lib \ encodings \ cp437.py ", строка 19, в закодировать, вернуть codecs.charmap_encode (входные данные, self.errors, encoding_map) [0]

UnicodeEncodeError: кодек 'charmap' не может кодировать символ '\ u2019' в позиции 187: символ отображается на

Извините, если это глупый вопрос, я только что скачал tesseract, и я не эксперт впрограммирования.

1 Ответ

0 голосов
/ 01 марта 2019

При возникновении ошибки: проблема в print(text) - вы пытаетесь напечатать текст в формате Unicode (utf-8) в консоли / среде, которая его не поддерживает.Поиск решения print UnicodeEncodeError windows, например Python, Unicode и консоли Windows

...