Question

Хы, я сейчас работаю над диссертацией, которая заключается в построении OCR для языка урду.У меня есть текст, написанный на изображениях.В CNN я знаю, что есть сверточные и объединяющие слои для изучения шаблонов или (извлечения особенностей).Что я прочитал о RNN, так это то, что он изучает последовательности.Я хочу спросить, как RNN извлекает функции, чтобы узнать, что на изображении?

Ahmad Raza · Answer 1 · 26 ноября 2018

RNN в основном требуются некоторые функции и метки на этапе обучения для изучения последовательности в данных.В случае числовых данных нет никаких проблем, мы просто делим наш набор данных на признаки (X) и целевое значение (Y).Но в случае данных изображения мы используем комбинацию CNN и RNN ( CNN-RNN ).Здесь в верхней части слоев RNN ( LSTM или GRU ) Сверточные слои используются для извлечения элементов из изображения, а затем мы передаем эти элементы слоям RNN.

Ali Mahdavi · Answer 2 · 08 октября 2018

сеть RNN использует скрытый слой, который обновляется с течением времени.Взятие образцов и прогнозирование следующих образцов на основе уменьшения ошибки (или потери).LSTM - это тип RNN, которые позволяют забыть о долговременных зависимостях.Может быть, этот тип, может быть полезным для вашей диссертации.

Как RNN извлекает элементы из изображения

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как RNN извлекает элементы из изображения

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы