Невозможно извлечь текст из изображения - PullRequest
2 голосов
/ 28 мая 2020

Я работал над проектом, в котором для извлечения текста из изображения использовался tesseract. Я также использую python 3.7.7, но я получаю сообщение об ошибке, которое не могу решить.

tess.pytesseract.tesseract_cmd = r'C:\\Program Files (x86)\\Tesseract-OCR\\tess1\\eng.traineddata'

img = Image.open('C:\\Users\\USER\\PycharmProjects\\selenium\\automation\\screenshot.png')
text = tess.image_to_string(img, lang='eng')

Когда я запускаю это, я получаю сообщение об ошибке

Traceback (most recent call last):
  File "C:/Users/USER/PycharmProjects/selenium/automation/open.py", line 8, in <module>
    text = tess.image_to_string(img, lang='eng')
  File "C:\Users\USER\PycharmProjects\selenium\venv\lib\site-packages\pytesseract\pytesseract.py", line 360, in image_to_string
    }[output_type]()
  File "C:\Users\USER\PycharmProjects\selenium\venv\lib\site-packages\pytesseract\pytesseract.py", line 359, in <lambda>
    Output.STRING: lambda: run_and_get_output(*args),
  File "C:\Users\USER\PycharmProjects\selenium\venv\lib\site-packages\pytesseract\pytesseract.py", line 270, in run_and_get_output
    run_tesseract(**kwargs)
  File "C:\Users\USER\PycharmProjects\selenium\venv\lib\site-packages\pytesseract\pytesseract.py", line 241, in run_tesseract
    raise e
  File "C:\Users\USER\PycharmProjects\selenium\venv\lib\site-packages\pytesseract\pytesseract.py", line 238, in run_tesseract
    proc = subprocess.Popen(cmd_args, **subprocess_args())
  File "C:\Python37\lib\subprocess.py", line 800, in __init__
    restore_signals, start_new_session)
  File "C:\Python37\lib\subprocess.py", line 1207, in _execute_child
    startupinfo)
OSError: [WinError 193] %1 is not a valid Win32 application

Пожалуйста, укажите подходящее решение

1 Ответ

0 голосов
/ 09 июня 2020

Для использования pytesseract в системе должно быть установлено программное обеспечение Tesseract. pytesseract - это просто библиотека, которая вызывает внутренний механизм OCR Tesseract.

Установка Tesseract

Для Windows

добавление пути к переменной пути

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...