Это, вероятно, означает, что ваше изображение в формате TIFF имеет альфа-канал, и, следовательно, лежащая в основе библиотека Leptonica, используемая Tesseract, не поддерживает его.Если вы используете Imagemagick, помните, что такие операции, как -draw
, могут привести к добавлению альфа-каналов.Если вы используете convert
в своем рабочем процессе и хотите немедленно снова удалить канал, сгладьте изображение перед записью, добавив -background white -flatten +matte
перед именем выходного файла, например:
convert input.tiff -fill white -draw 'rectangle 10,10 20,20' -background white -flatten +matte output.tiff
Tesseract (ну,Leptonica) в настоящее время принимает PNG и менее требователен к ним, поэтому в любом случае может быть проще перенести рабочий процесс на PNG.
Источники: magick-users отправка списка рассылки ;tesseract-ocr отправка списка рассылки