Целостный алгоритм распознавания слов в деталях - PullRequest
2 голосов
/ 21 декабря 2010

Где я могу найти детали алгоритма для целостного распознавания слов?Мне нужно построить простую систему OCR на аппаратном уровне (собственно FPGA), а научные журналы кажутся такими абстрактными?

Существуют ли какие-либо коды с открытым исходным кодом (с открытым ядром) для целостного распознавания слов?Спасибо

1 Ответ

4 голосов
/ 23 декабря 2010

Для алгоритма, который вполне подходит для реализации FPGA (смущающе параллельно), вы можете посмотреть:

http://en.wikipedia.org/wiki/Cross-correlation

Это быстро и легко реализуется.

Единственное: он распознает форму (в вашем случае некоторый текст) в ЗАВИСИМОСТИ от поворота и размера / растяжения / перекоса и т. Д. Но если это не проблема, он может быть очень быстрым и достаточно устойчивым. Вам следует только следить за проблемами интерпретации с похожими символами (такими как o и c).

Я использовал его для поиска текстов по умолчанию на отсканированных формах, чтобы получить ориентиры там, где есть область интересов, и поиск в этих изображениях (6M пикселей) занял около 15 мс с нашей реализацией на процессоре Core2 в одном потоке.

...