Тессеракт для логотипов и шрифтов - PullRequest
0 голосов
/ 20 апреля 2020

Есть несколько логотипов, для которых нужно запустить OCR. Логотипы обычно имеют разные шрифты. Образец ниже. Когда tesseract был запущен со всеми возможными значениями psm, RITZ не обнаруживался. Также попытался преобразовать в черно-белое с использованием cv2.threshold(grayImage, 120, 255, cv2.THRESH_BINARY), но R не обнаруживается. Может кто-нибудь сказать, какую технику нужно сделать для этих странных шрифтов. (Я использую python)

RITZ logo
enter image description here

1 Ответ

0 голосов
/ 20 апреля 2020

Это проблема с tessaract, он не может обнаружить сложные или рукописные символы. Мы можем использовать тессеракт для простого обнаружения печатных символов. Для сложных или рукописных вы можете попробовать алгоритм CNN или KNN, обученный в наборе данных. (Chars74k, AZ Handwritting)

...