Я следовал инструкциям в https://github.com/tesseract-ocr/tesstrain на Windows10.
Он продолжает показывать эту ошибку Ошибка: сначала отсутствует основополагающая истина для обучения. Это потому, что код не работает на Windows:
(ALL_LSTMF): $(patsubst %.gt.txt,%.lstmf,$(shell find $(GROUND_TRUTH_DIR) -name '*.gt.txt'))
@mkdir -p $(OUTPUT_DIR)
find $(GROUND_TRUTH_DIR) -name '*.lstmf' | python3 shuffle.py $(RANDOM_SEED) > "$@"
, и я изменяю его на:
$(ALL_LSTMF): $(patsubst %.gt.txt,%.lstmf,$(wildcard $(GROUND_TRUTH_DIR)/*.gt.txt))
@mkdir -p $(OUTPUT_DIR)
find $(GROUND_TRUTH_DIR) -name '*.lstmf' -exec echo {} \; | sort -R -o "$@"
Затем ошибка исчезла.
Измененный код взят из старой версии tesseract-ocr / tesstrain. Он должен работать как на linux, так и на windows. Возможно, вы можете попробовать.