Интеграция Tesseract OCR на веб-странице - и многое другое - PullRequest
0 голосов
/ 25 сентября 2018

Как интегрировать Тессеракт OCR в веб-страницу так, чтобы:

  1. Пользователь выбирает файл через системное диалоговое окно с действием кнопки (тип ввода, файл).
  2. Загруженное изображение затем подвергается сценарию Тессеракта, и вывод оптического распознавания отображается на самой веб-странице.

1 Ответ

0 голосов
/ 25 сентября 2018

Существует огромная скрытая проблема с запуском tesseract на веб-странице.

pytesseract, популярная оболочка tesseract для Python, вызывает subprocess и Popen для запуска tesseract из командной строки,затем анализирует результаты и возвращает их вам.

Создание подпроцесса из веб-запроса (кроме тех, которые непосредственно управляются вашим веб-сервером):

  1. Сбой или остановка большинства веб-сайтов Pythonframeworks
  2. Сбой или остановка процессов WSGI
  3. Создание тонн процессов зомби
  4. Общей трудностью справиться

Итак, мой совет заключается вnot.

Ищите решение OCR, которое работает на чистом Python или взаимодействует с Python через статически скомпилированный общий объект.

Какое решение для OCR это делает ... Понятия не имею.

...