Тессеракт OCR build
Я хочу развернуть tesseract-OCR на лямбде.Перейдите к разделу, где говорится об адаптациях для tesseract 4. Я построил tesseract, следуя этому руководству.Но я столкнулся с проблемой, так как сборка не переносима.Всякий раз, когда я пытаюсь использовать встроенный в новый экземпляр Linux, мне приходится устанавливать переменную окружения PATH равной / tmp, иначе это не будет работать.
Структура
├── cv2
├── lib
├── numpy
├── PIL
├── pytesseract
├── tessdata
├── tesseract
├── test.png
└── zzz.py
https://s3.amazonaws.com/tesseractstandalone/complete-package.zip
Это ссылка на автономный тессеракт.Есть пример программы zzz.py, в которой есть скрипт для запуска tesseract.Когда я загружаю zip и распаковываю в папку / tmp / в экземпляре ec2, программа работает нормально.Но у меня возникла проблема при работе с лямбдой.Когда я пытаюсь загрузить ту же самую вещь в папку lambda / tmp /, я получаю сообщение об ошибке, которое говорит, что tesseract не установлен или не находится на вашем пути.Не знаю, где что-то идет не так.Не уверен, является ли это проблемой ПУТИ или лямбды.