Сравнение рукописного текста с использованием Reinforcement Learning - PullRequest
0 голосов
/ 30 апреля 2020

Я хочу создать агент RL, который может оправдать, если написанное от руки слово написано законным пользователем или нет. План таков:

Допустим, я написал любое слово 10 раз и извлек некоторые геометрические свойства для всех из них, чтобы использовать их в качестве элементов. Затем я обучил агента RL научиться принимать решения на основе различий между геометрическими свойствами новых и старых 10 рукописных текстов. Награда присуждается за правильную идентификацию и ничего или отрицательно за неправильную.

Я иду в правильном направлении или мне не хватает чего-то жизненно важного? Можно ли обучить агента только с 10 образцами? На самом деле, как новый студент RL, я запутался в случае использования RL; если он лучше всего подходит для решения игровых задач и роботов c, или он также подходит для прогнозирования на основе обучения.

1 Ответ

0 голосов
/ 30 апреля 2020

Усиление обучения будет использоваться со временем. Если бы вы следили за ходом ручки, со временем выясните, в каком направлении она движется, это было бы больше рулевой рубки обучения подкреплению. Измерение времени (или ряда состояний) является причиной его использования в играх, таких как Starcraft II.

Вы говорите о том, чтобы сделать снимок текста, который был написан, и в конечном итоге классифицировать его как логическое (Хорошо или Не). Вы ищете больше сверточных нейронных сетей для решения вашей проблемы (эти типы алгоритмов хороши для изображений).

В конце концов вы не сможете сказать. Есть методы с GAN (Generative Adversarial Networks), которые могут тренироваться с вашим дискриминатором и, наконец, выяснить шаблон, который он ищет, и обмануть его. Но это звучит хорошо, как домашнее задание.

...