Усиление обучения будет использоваться со временем. Если бы вы следили за ходом ручки, со временем выясните, в каком направлении она движется, это было бы больше рулевой рубки обучения подкреплению. Измерение времени (или ряда состояний) является причиной его использования в играх, таких как Starcraft II.
Вы говорите о том, чтобы сделать снимок текста, который был написан, и в конечном итоге классифицировать его как логическое (Хорошо или Не). Вы ищете больше сверточных нейронных сетей для решения вашей проблемы (эти типы алгоритмов хороши для изображений).
В конце концов вы не сможете сказать. Есть методы с GAN (Generative Adversarial Networks), которые могут тренироваться с вашим дискриминатором и, наконец, выяснить шаблон, который он ищет, и обмануть его. Но это звучит хорошо, как домашнее задание.