Существует множество предварительно обученных моделей машинного перевода, но кажется, что все они должны работать со словарем, с которым они обучены. Словари иногда могут иметь меньший охват моего набора данных (даже на основе BPE), а иногда пропускают важные слова как неизвестные. Как лучше всего настроить предварительно обученные модели для словаря, полученного из моего собственного набора данных? Например, какой-нибудь способ передачи обучения, например разморозка слоев кодера и переподготовка?