Могу ли я настроить словарь предварительно обученной модели нейронного машинного перевода трансформатора? - PullRequest
0 голосов
/ 11 октября 2019

Существует множество предварительно обученных моделей машинного перевода, но кажется, что все они должны работать со словарем, с которым они обучены. Словари иногда могут иметь меньший охват моего набора данных (даже на основе BPE), а иногда пропускают важные слова как неизвестные. Как лучше всего настроить предварительно обученные модели для словаря, полученного из моего собственного набора данных? Например, какой-нибудь способ передачи обучения, например разморозка слоев кодера и переподготовка?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...