Почему файл .traineddata от Tesseract не отображается в heroku, несмотря на успешную загрузку и извлечение? - PullRequest
0 голосов
/ 01 ноября 2018

Я пытаюсь развернуть приложение OCR через heroku с Tesseract. wget ting .traineddata файлы вызывают ошибку, поэтому я решил сжать их в .tar.gz файл и загрузить их в пользовательский пакет сборки, из которого собирается приложение. Однако присутствует только файл eng.traineddata по умолчанию, а остальные файлы .traineddata почему-то удаляются. Журнал сборки показывает, что файлы извлечены успешно. Вставка журнала сборки ниже:

Counting objects: 1, done.
Writing objects: 100% (1/1), 183 bytes | 0 bytes/s, done.
Total 1 (delta 0), reused 0 (delta 0)
remote: Compressing source files... done.
remote: Building source:
remote: 
remote: -----> Python app detected
remote:        Using supported version of Python 3.6 (python-3.6.6)
remote: -----> Installing requirements with pip
remote: 
remote: -----> detect app detected
remote: Unpacking Tesseract-OCR binaries
remote: ./
remote: ./bin/
remote: ./bin/tesseract
remote: ./share/
remote: ./share/tessdata/
remote: ./share/tessdata/eng.traineddata
remote: ./lib/
remote: ./lib/libtesseract.so.4
remote: ./lib/liblept.so.5
remote: ./lib/libpng12.so.0
remote: ./lib/libgif.so.7
remote: Getting Tesseract-OCR training data
remote: eng.traineddata
remote: ben.traineddata
remote: eng training data
remote: ben training data
remote: traineddata files loaded 
remote: ben.traineddata
remote: eng.traineddata
remote: Building runtime environment for Tesseract-OCR
remote: -----> Discovering process types
remote:        Procfile declares types -> web
remote: 
remote: -----> Compressing...
remote:        Done: 73.7M
remote: -----> Launching...
remote:        Released v24
remote:        https://brocr.herokuapp.com/ deployed to Heroku
remote: 
remote: Verifying deploy... done.
To https://git.heroku.com/brocr.git
   c7866b8..961e948  master -> master

Вот вывод команды ls -as в каталоге $TESSDATA_PREFIX:

~$ ls -as $TESSDATA_PREFIX
total 22928
    4 .      4 ..  22920 eng.traineddata

Вот скрипт компиляции для пользовательского пакета сборки. Я что-то упустил?

...