Что лучше вводить в ANN для распознавания текста: граница персонажа или его заполнение? - PullRequest
1 голос
/ 20 февраля 2012

Мне трудно решить, что лучше (с точки зрения производительности) подавать в ANN для целей OCR. Я нашел прямоугольные области, которые содержат символы, и теперь я хотел бы знать, что лучше использовать:

  • Граница персонажа

0 0 0 0 0 0 0 0 0 0 0

0 0 1 1 1 1 1 1 1 1 0

0 0 1 0 0 0 0 0 0 1 0

0 0 1 0 0 0 0 0 0 1 0

0 0 1 1 1 1 1 1 1 1 0

  • заполнение персонажа

0 0 0 0 0 0 0 0 0 0 0

0 0 1 1 1 1 1 1 1 1 0

0 0 1 1 1 1 1 1 1 1 0

0 0 1 1 1 1 1 1 1 1 0

0 0 1 1 1 1 1 1 1 1 0

Я спрашиваю перед тестированием mydelf, потому что подготовка образцов займет у меня много времени. Извините за форматирование, но я не могу установить правильные блоки кода.

1 Ответ

1 голос
/ 05 марта 2012

Я думаю, вам будет нелегко выяснить, каков оптимальный метод, прежде чем вы на самом деле попробуете, потому что вы не сможете предсказать, будет ли ваш метод вообще давать вам достойный результат в любом случае, даже если он будет означать меньшевходные данные.

Это классическая проблема, которая обсуждалась в классических текстах, здесь есть пример на Java: http://www.heatonresearch.com/articles/7 Вы не объяснили структуру своего предполагаемого ANN, это можетбыть реализовано таким образом, что вам нужно решить и объяснить, какой тип ANN вы собираетесь использовать.Вы можете использовать сети автоассоциирования, NN со скрытым слоем с обратным распространением и т. Д.

...