Тессеракт не может найти eng.traineddata - PullRequest
1 голос
/ 14 октября 2019

У меня есть программа на Python, которая использует ядро ​​tesseract ocr. Сначала все работало нормально. Однако я удаляю tesseract и переустанавливаю его, на этот раз он не работает.

Даёт

pytesseract.pytesseract.TesseractError: (1, 'Error opening data file C:\\Program Files\\Tesseract-OCR/eng.traineddata Please make sure the TESSDATA_PREFIX

Я ничего не менял, но не работает.

Я добавляю TESSDATA_PREFIX к пути.

Но когда я перемещаю eng.traineddata из tesstada в файл tesseract-ocr, это сработало. У меня есть другой компьютер, и у него та же программа, и она работает хорошо. Однако eng.traineddata находится в папке tessdata.

Почему одна программа выдает ошибку, а другая нет?

РЕДАКТИРОВАТЬ

1) 'C: \ Program Files \ Tesseract-OCR / eng.traineddata' делаетне существует в двух компьютерах. Однако один из них работает, а другой не работает. Поэтому, как я уже сказал в этом вопросе, я перемещаю eng.traineddata из tessdata в папку Tesseract-OCR, и затем это работает. Но вот вопрос, почему один из них работает, а другой не работает? Поскольку другая программа не имеет eng.traineddata в папке Tesseract-OCR.

2) Я загрузил исполняемый файл windows tesseract из библиотеки mannheim uni. Таким образом, файл не поврежден.

3) Я использую Tesseract 3.05

4) Я создал переменную TESSDATA_PREFIX env.

5) Я загрузил исполняемый файл windows с tesseract изУниверситетская библиотека Мангейма.

Большое спасибо.

1 Ответ

0 голосов
/ 15 октября 2019
  1. Существует ли 'C: \ Program Files \ Tesseract-OCR / eng.traineddata'?
  2. Вы проверили, не поврежден ли файл (например, вы загрузили его правильно)
  3. Из какого источника (репозитория tessdata) вы его скачали?
  4. Добавление TESSDATA_PREFIX к путям бесполезно: вам нужно настроить переменную env TESSDATA_PREFIX.
  5. Предоставить полный код, как вы настраиваете изапустить pytesseract. Отображение только (часть) сообщения об ошибке не помогает.
...