Я хочу, чтобы tesseract ORC запускал файл изображения для сканирования содержимого.Кажется, проблема в том, что tesseract не только требует TIFF, но также требует, чтобы файл TIFF был в определенном формате.
Имея обычный файл TIFF, я получаю:
root@toshiba:~/Desktop# tesseract crap.tif crap.txt
Tesseract Open Source OCR Engine
check_legal_image_size:Error:Only 1,2,4,5,6,8 bpp are supported:32
Segmentation fault
До сих пор мне удалось найти противоядие.Он состоит из использования GIMP, перехода в Image> Mode> Indexes и установки «Generate Optimum Palette», «максимальное количество цветов» на 256.тогда я должен сделать еще один трюк перед "Сохранить как".Перейдите в меню «Слой»> «Прозрачность»> «Удалить альфа-канал», что приведет к удалению прозрачности, поскольку изображения TIF не могут иметь прозрачность.
Теперь проблема в том, что мое входное изображение получено из C # и предварительно обработано фильтрами анализа изображений AFORGE.NET.
Я также обнаружил .NETпорт LibTiff и пример того, как написать изображение с цветовой палитрой здесь:http://bitmiracle.com/libtiff/help/create-tiff-with-palette-(color-map).aspx
Но я не знаю, как получить данные от исходного tiff (с неправильной палитрой) до целевого tiff (с правильным форматом палитры) ...