Я хочу запустить несколько небольших изображений / спрайтов через OCR (возможно, Tesseract) и извлечь из них число или слова, и я знаю, что эти числа / слова будут иметь определенный цвет c (скажем, белый на шумный / цветной фон).
Читая о предварительной обработке изображений для OCR, я подумал, что было бы действительно полезно просто удалить из изображения все, что не является белым.
Я используя как imagemagick
, так и vips
, но я понятия не имею, с чего начать, какие операции использовать и как его искать.