Question

Есть несколько логотипов, для которых нужно запустить OCR. Логотипы обычно имеют разные шрифты. Образец ниже. Когда tesseract был запущен со всеми возможными значениями psm, RITZ не обнаруживался. Также попытался преобразовать в черно-белое с использованием cv2.threshold(grayImage, 120, 255, cv2.THRESH_BINARY), но R не обнаруживается. Может кто-нибудь сказать, какую технику нужно сделать для этих странных шрифтов. (Я использую python)

Shashank Lipate · Answer 1 · 20 апреля 2020

Это проблема с tessaract, он не может обнаружить сложные или рукописные символы. Мы можем использовать тессеракт для простого обнаружения печатных символов. Для сложных или рукописных вы можете попробовать алгоритм CNN или KNN, обученный в наборе данных. (Chars74k, AZ Handwritting)

Тессеракт для логотипов и шрифтов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Тессеракт для логотипов и шрифтов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы