Question

Интересно узнать, хороши ли длинные предложения для обучения модели тензорного тензора. А почему или почему нет?

Martin Popel · Answer 1 · 18 января 2019

В идеале обучающие данные должны иметь такое же распределение длин предложений, как и целевые тестовые данные. Например. в машинном переводе, если длинные предложения предназначены для перевода по окончательной модели, аналогично длинные предложения следует использовать и для обучения. Модель Transformer, по-видимому, не обобщает более длинные предложения, чем те, которые использовались для обучения, но ограничение максимальной длины предложения в обучении позволяет использовать более крупные размеры пакетов, что полезно ( Popel and Bojar, 2018 ).

Длинные предложения не подходят для моделей глубокого обучения?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Длинные предложения не подходят для моделей глубокого обучения?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы