Как RNN извлекает элементы из изображения - PullRequest
0 голосов
/ 08 октября 2018

Хы, я сейчас работаю над диссертацией, которая заключается в построении OCR для языка урду.У меня есть текст, написанный на изображениях.В CNN я знаю, что есть сверточные и объединяющие слои для изучения шаблонов или (извлечения особенностей).Что я прочитал о RNN, так это то, что он изучает последовательности.Я хочу спросить, как RNN извлекает функции, чтобы узнать, что на изображении?

Ответы [ 2 ]

0 голосов
/ 26 ноября 2018

RNN в основном требуются некоторые функции и метки на этапе обучения для изучения последовательности в данных.В случае числовых данных нет никаких проблем, мы просто делим наш набор данных на признаки (X) и целевое значение (Y).Но в случае данных изображения мы используем комбинацию CNN и RNN ( CNN-RNN ).Здесь в верхней части слоев RNN ( LSTM или GRU ) Сверточные слои используются для извлечения элементов из изображения, а затем мы передаем эти элементы слоям RNN.

0 голосов
/ 08 октября 2018

сеть RNN использует скрытый слой, который обновляется с течением времени.Взятие образцов и прогнозирование следующих образцов на основе уменьшения ошибки (или потери).LSTM - это тип RNN, которые позволяют забыть о долговременных зависимостях.Может быть, этот тип, может быть полезным для вашей диссертации.

...