Question

В настоящее время я работаю над моделью seq2seq, но не могу понять, что распределяется между декодером поезда и декодером логического вывода.

bytestorm · Answer 1 · 01 июля 2019

В архитектуре seq2seq в простейшей форме у вас есть одна ячейка RNN (например, LSTM или GRU или vannal RNN) для кодера и другая ячейка RNN для декодера.Во время тренировок вы обновляете весовые матрицы в этих единицах.По окончании тренировки вы фиксируете и сохраняете изученные весовые матрицы.И во время логического вывода вы используете те же блоки кодера и декодера (как в блоках RNN с сохраненными весовыми матрицами).

Что отличается во время обучения и логического вывода, так это то, что в основном вы будете использовать ячейку RNN декодера.Во время обучения каждый раз подает токены истины на декодер.Принимая во внимание, что при выводе вы используете декодер для вычисления идентификаторов токенов для выходной последовательности один за другим и передачи их обратно.

Что распределяется между поездом и декодером логического вывода в модели seq2seq?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Что распределяется между поездом и декодером логического вывода в модели seq2seq?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы