Преобразование изображения в текст: как обрезать отдельные слова в отдельные файлы? - PullRequest
1 голос
/ 14 января 2011

Мне нужно сделать что-то похожее на это Как написать скрипт bash, который разрезает изображения на части, используя магию изображений?

Но я заранее не знаю, где находятся области иих размер: мне нужно определить «ящики», в которых содержится каждое слово, а затем обрезать каждое из них и сохранять их в отдельные файлы.

1 Ответ

1 голос
/ 06 апреля 2011

Большинство программ для распознавания текста делает что-то подобное, так что вы можете попробовать найти какой-нибудь исходный код для программы распознавания. Много лет назад я провел много времени с кодом для GOCR (http://jocr.sourceforge.net/),, который имеет довольно простую реализацию этого алгоритма.

Если вы не хотите писать код, я не уверен, что предложить. Но если вы можете найти программное обеспечение, которое разбивает изображения на куски в зависимости от пробелов, вы можете попробовать размывать изображение (чтобы превратить текст в капли), а затем устанавливать пороговые значения и находить поля из этого. Не ясно, что результаты были бы очень полезны.

...