Поиск в файловой системе текста в изображении - PullRequest
0 голосов
/ 25 января 2012

Я хочу иметь возможность искать всю мою файловую систему или даже просто каталог для изображений, которые содержат текстовую строку. Это, конечно, будет использовать OCR (оптическое распознавание символов).

Оптимально, это будет работать в фоновом режиме и создавать индекс всего текста во всех изображениях.

Мое объяснение этому заключается в том, что у меня есть много снимков экрана, которые содержат текст, и я хочу иметь возможность поиска по ним.

Кто-нибудь знает о существующем решении? Если нет, то я подумываю о том, чтобы сделать свой собственный, используя библиотеку OCR. Любые предложения о том, как это реализовать?

Основной целевой платформой является Windows 7.

Ответы [ 2 ]

1 голос
/ 27 января 2012

VietOCR отслеживает папку просмотра новых файлов входных изображений и выполняет распознавание по ним. Он не поддерживает индексацию. Программа с открытым исходным кодом; Вы можете расширить его функциональность в соответствии с вашими требованиями.

0 голосов
/ 26 января 2012

Конечно, есть много решений, которые вы описываете.Прежде всего, существует класс продуктов, называемых «Системы управления документами», которые позволяют индексировать все документы в компьютере или сети.Многие из них опционально предоставляют функции индексации OCR и текстовых изображений.Во-вторых, есть набор продуктов «Корпоративная поисковая система», которые также предоставляют такие возможности (, даже у Google есть один ).Наконец, посмотрите на термин электронного открытия .Это подкласс систем управления документами, которые используются в США для юридических нужд.

Я считаю, что это довольно дорогие корпоративные решения, может быть, где-то есть выпуски SoHo, попробуйте поискать что-то, что я упомянул выше.

...