Входные данные нейронной сети, координаты x / y декартовой плоскости, соотнесенные с почерком - PullRequest
4 голосов
/ 06 января 2011

Мне очень интересно создать приложение для распознавания рукописного ввода в веб-браузере.Пользователи рисуют письмо, ajax отправляет данные на сервер, нейронная сеть находит наиболее близкое совпадение и возвращает результаты.Поэтому, если вы рисуете a, первым результатом должно быть a, затем o, затем e, что-то в этом роде.

Я не знаю много о нейронных сетях.Какие данные мне нужно передать NN.Может ли это быть массив координат х / у, где пользователь нарисовал на планшете.Или какой тип данных ожидает нейронная сеть или даст наилучшие результаты для почерка?

Ответы [ 3 ]

2 голосов
/ 06 января 2011

Вам нужно будет отправить не только координаты X / Y, но и ПОРЯДОК, в котором они были нарисованы. Таким образом, путь может быть лучше, чем просто набор точек. Нейронная сеть должна быть в состоянии справиться с этим, и есть много способов это сделать. Одним из способов может быть разделение пути на n сегментов для n нейронов, и каждый нейрон распознает часть буквы.

1 голос
/ 20 января 2011

Основной процесс состоит в том, чтобы накапливать несколько примеров каждой буквы, которая должна быть идентифицирована, предварительно обрабатывать необработанные данные, обучать коллекцию моделей-кандидатов и выбирать окончательную модель, основанную на результатах тестирования, на отдельном, несдерживаемом наборе данных. .

Характер предварительной обработки будет зависеть от данных, которые вы собираете. Если данные перемещения пера «соединяют точки», то может быть проще всего разделить изображение на области и суммировать их по количеству точек на область. Если вместо этого вы записываете растровое изображение, будет полезна другая предварительная обработка, такая как простая статистика и профили вертикальной и горизонтальной проекции (средние значения для строк и столбцов).

«Журнал доктора Добба» несколько лет назад провел конкурс по распознаванию отпечатков рук (с использованием электронных чернил). Вы можете прочитать об этом здесь:

http://www.drdobbs.com/184408743;jsessionid=IG5ALGCW1HZZVQE1GHPCKH4ATMY32JVN?pgno=4

... и здесь:

http://www.drdobbs.com/184408923;jsessionid=IG5ALGCW1HZZVQE1GHPCKH4ATMY32JVN?pgno=2

1 голос
/ 06 января 2011

Как правило, простые NN для распознавания изображения / рукописного ввода принимают в качестве входных данных 2-мерную логическую матрицу; то есть черно-белое растровое изображение. Убедитесь, что у вас есть тренировочный набор из них; или пусть пользователь обучит алгоритм, используя онлайн-обучение backprop.

@ Предложение FrustratedWithFormsDesigner также об отправке заказа может сделать NN намного «умнее», но если вы только учитесь, сначала попробуйте битовую версию и посмотрите, насколько хорошо она работает. Кроме того, поиграйте с гранулярностью растрового изображения. Возможно, сначала попробуйте распознать цифры, в сети есть стандартные наборы данных для этой проблемы.

...