Как работать с более длинными токенами, чем с кодировщиком в модели NMT

В модели NMT (такой как seq2seq или модель внимания), как я могу переводить длинные предложения с более длинными токенами, чем кодировщик?Должен ли я переделать нейронную сеть (с более длинным входным размером) или у меня может быть какое-то недопонимание относительно кодера?

Как работать с более длинными токенами, чем с кодировщиком в модели NMT

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как работать с более длинными токенами, чем с кодировщиком в модели NMT

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы