Чтение результатов тессерактов прямо в Python - PullRequest
0 голосов
/ 22 мая 2019

Мне было просто любопытно, как я собираюсь захватывать данные с использованием tesseract и читать эти данные в одном и том же файле python.

В настоящее время я записываю данные в текстовый файл, затем читаю текстовый файл обратно впрограмма, это боль.

import pyautogui
import imutils
import cv2
from PIL import Image
import pytesseract

pyautogui.screenshot("ScreenShot.png")

im = Image.open("ScreenShot.png")
text = pytesseract.image_to_string(im, lang = 'eng')

print(text)
im.close()

Я ожидаю, что print на самом деле напечатает захваченный здесь текст, однако он возвращает эту ошибку: UnicodeEncodeError: 'charmap' codec can't encode character '\xae' in position 128: character maps to <undefined>

Я также пытался сделать: text = str(text, 'UTF-8')

Однако это возвращает эту ошибку: TypeError: decoding str is not supported

Редактировать: Также, если у кого-то есть какие-либо советы по поводу чего-либо, что вы здесь видите, пожалуйста, дайте мне знать, я не супер опыт, как вы, возможно, былив состоянии угадать, поэтому вся критика полезна.

...