Как выделить слово на изображении? - PullRequest
2 голосов
/ 18 сентября 2010

Я бы хотел иметь возможность выделить слово на изображении документа, когда пользователь ищет это слово.Точно так же, как Google Books делает здесь .

Насколько я знаю, Tesseract и другие программы OCR с открытым исходным кодом не поддерживают такую ​​функцию, поэтому у кого-нибудь есть идеи, как это можетбыть сделано?

1 Ответ

2 голосов
/ 18 сентября 2010

Да, они "поддерживают" это.Вроде.

Они дают вам прямоугольник, который говорит вам, где слово.Используя это, заполните указанный прямоугольник цветом по вашему выбору на изображении, используя режим смешивания цветов (например, сохраняйте яркость без изменений и просто изменяйте цветность).Это хорошо работает с черно-белыми изображениями и изображениями в градациях серого, которые есть в большинстве книг, и достаточно для большинства цветных шрифтов (кроме тех, что на цветном фоне).Решением этой проблемы является инвертирование цветов вместо их выделения, это делается во многих приложениях (на ум приходит Foxit Reader).

...