Проблемы с использованием Tesseract-OCR на Python - PullRequest
0 голосов
/ 07 июня 2018

Я новичок в программировании и пытаюсь использовать Tesseract OCR для чтения текста изображения, но я не могу заставить его работать!Я установил tesseract_OCR, pytesseract и подушку в моей среде.У кого-нибудь есть совет?

Ввод:

from PIL import Image 

import pytesseract

print( pytesseract.image_to_string( Image.open('phrase.jpg') ) ) 

Ввод:

 C:\Anaconda2\envs\ambiente36\python.exe 

 C:/Users/Simone/Desktop/curso_programacao/Ler_imagens/ler_imagens

Traceback (most recent call last):

File "C:\Anaconda2\envs\ambiente36\lib\site- 
packages\pytesseract\pytesseract.py", line 194, in run_and_get_output
run_tesseract(**kwargs)

File "C:\Anaconda2\envs\ambiente36\lib\site- 
packages\pytesseract\pytesseract.py", line 165, in run_tesseract
proc = subprocess.Popen(command, **subprocess_args())

File "C:\Anaconda2\envs\ambiente36\lib\subprocess.py", line 709, in __init__
restore_signals, start_new_session)

File "C:\Anaconda2\envs\ambiente36\lib\subprocess.py", line 997, in 
_execute_child 
startupinfo)

FileNotFoundError: [WinError 2] O sistema não pode encontrar o arquivo 
especificado

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
File "C:/Users/Simone/Desktop/curso_programacao/Ler_imagens/ler_imagens", 
line 6, in <module>
phrase = pytesseract.image_to_string(Image.open('phrase.jpg'))

File "C:\Anaconda2\envs\ambiente36\lib\site- 
packages\pytesseract\pytesseract.py", line 286, in image_to_string
return run_and_get_output(image, 'txt', lang, config, nice)

File "C:\Anaconda2\envs\ambiente36\lib\site- 
packages\pytesseract\pytesseract.py", line 201, in run_and_get_output
raise TesseractNotFoundError()

pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed 
or it's not in your path

Ответы [ 2 ]

0 голосов
/ 13 июня 2018

Похоже, либо Tesseract установлен неправильно, либо путь к tesseract не указывает, где фактически был установлен tesseract.

pytesseract.pytesseract.TesseractNotFoundError: tesseract не установлен или не находится на вашем пути

Я предлагаю сначала проверить ваши установки, следуя официальной документации.

Недавно я написал довольно простое руководство по Тессеракту, но оно должно позволить вам написать свой первый скрипт OCR и устранить некоторые препятствия, с которыми я столкнулся, когда все было менее ясно, чем мне бы хотелосьв документации.

Если вы хотите проверить их, я делюсь с вами ссылками:

0 голосов
/ 07 июня 2018

Шаги, которые вы должны выполнить, чтобы настроить tessaract в вашей среде. Вот шаги, которые вы должны выполнить

сначала установите python и pip здесь - это шаги, затем установите подушку, pytesseract как здесь

from PIL import Image
from pytesser.pytesser import *

image_file = "FULL/PATH/TO/YOUR/IMAGE/image.png"
im = Image.open(image_file)
text = image_to_string(im)
text = image_file_to_string(image_file)
text = image_file_to_string(image_file, graceful_errors=True)
print "=====output=======\n"
print text

ссылка для скачать pytessaract вы можете найти полный пример здесь

...