Как обработать несколько целевых переводов для исходного термина в файлах словаря MS Hub - PullRequest
0 голосов
/ 22 октября 2018

При подготовке файла словаря языка для обучения MS Hub я сталкиваюсь с некоторыми исходными терминами, которые имеют более одного предпочтительного перевода.Должен ли я поместить их в две разные записи или каков наилучший способ для такого случая?Мне интересно, повлияет ли это на поведение системы при распознавании терминов / перевода.

Кроме того, можно ли оставить некоторые термины на определенных целевых языках пустыми, если я хочу создать многоязычный словарь?Это сэкономило бы мне время вместо того, чтобы готовить глоссарий для каждой языковой пары с одинаковыми исходными языками.Но я не уверен, что если оставить термин пустым на целевом языке, это приведет к тому, что модель будет рассматривать этот термин как пустую запись в переводе ...

Большое спасибо!

1 Ответ

0 голосов
/ 26 октября 2018

Словарь фраз применяется с вероятностью 100%.Вы можете иметь несколько исходных фраз, отображаемых на одну и ту же целевую фразу, но вы не можете иметь несколько целевых фраз для одного и того же источника в словаре.Вы можете использовать эту фразу в своем обычном учебном материале, и переводчик предпочтет вариант, соответствующий вашему контексту.

Всегда лучше позволить системе выучить слова и фразы, которые вы предпочитаете, из вашего учебного материала в полных предложениях.Переводчик изучает перегибы и контекст из ваших примеров предложений.Вы можете считать словарь опорой, если у вас недостаточно учебного материала, содержащего полные предложения, содержащего примеры ваших фраз.

Многоязычный словарь должен быть достаточно умным, чтобы игнорировать пустые ячейки.Я не уверен на 100% в этом.

...