Я запускаю Python через консольную среду Anaconda / Spyder Версия - 3.7.2 (по умолчанию, 2 января 2019, 17:07:39) [MSC v.1915 64 бит (AMD64)]
У меня естьследовал рекомендациям из этого поста stackoverflow: Ошибка Tesseract * Found
для устранения следующей ошибки:
TesseractNotFoundError: C: \ Program Files \ Tesseract-OCR esseract.exe не установлен или не находится на вашем пути
Обратите внимание, что часть пути отсутствует.Он устанавливается по адресу: C: \ Program Files \ Tesseract-OCR \ tesseract.exe
В моем файле pytesseract.py я изменил путь, как это было предложено: tesseract_cmd = 'C: \ Program Files \ Tesseract-OCR\ tesseract.exe
Это не решило мою проблему и привело к появлению сообщения об ошибке, в котором отсутствует часть строки пути.
TesseractNotFoundError: C: \ Program Files \ Tesseract-OCR esseract.exe не установлен или его нет в вашем пути
Поэтому я поиграл с этим и добавил секунду \, как показано ниже:
Код Python:
tesseract_cmd = 'C: \ Program Files \ Tesseract-OCR \\ tesseract.exe'
Теперь это прекрасно работает, прочитайте и успешно конвертируйте всю газетуизображение страницы в тексте строки.
Ничто в рекомендациях, которым я следовал, изначально не указывало на то, что мне нужно было добавить секунду \ к пути, и я не понимаю, зачем мне это делать.
Буду благодарен за любые указания о том, почему это произошло?