Я пишу программу для извлечения информации из правительства. Идентификаторы и использование контуров для извлечения символов из изображения (поскольку передача его как есть, в тессеракт приводит к выводу нежелательной информации). Я попробовал этот подход с другими печатными документами, и он дает гораздо лучшие результаты, чем передача всего изображения в тессеракт. Но по какой-то причине, с изображениями идентификаторов правительства, кажется, либо выдается «Ошибка в pixGenHalftoneMask: pix too small» (хотя изображения имеют размер не менее 100x100), либо выводится пустой текст. Я прилагаю оба изображения
Я использовал psm 10 для изображения с буквой «M» и 8 для другого изображения, но он не принес никаких плодов. У меня ощущение, что персонаж слишком толстый? я тоже пробовал эрозию ... но конечный результат был тот же :( .. какие-нибудь указатели, пожалуйста?