Пользовательский переводчик - Как я могу научить машину распознавать правильное решение для перевода (синонимы)? - PullRequest
0 голосов
/ 06 марта 2020

Я довольно новичок в Custom Translator и работаю над проектом EN_KO, связанным с модой. Во многих случаях один термин Engli sh имеет два возможных перевода на корейский язык. Пример: если «крепление» относится к «сумкам, рюкзакам ...», это 잠금, а если оно относится к «одежде, обуви ...», это 여밈. Я хотел бы обучить машину распознавать эти различия. Может быть полезно загрузить словарь фраз? Любые идеи? Спасибо!

1 Ответ

1 голос
/ 29 марта 2020

Цель обучения специальной системе перевода - научить ее переводить термины в контексте.

Лучший способ научить систему переводу - это обучение параллельными документами с прозаической фразой: один и тот же документ на двух языках. Извлечение памяти переводов в файле TMX или XLIFF - лучший материал, но подходит и множество других форматов документов, если у вас есть оба языка. Подготовьте не менее 10000 предложений на обоих языках, загрузите их на http://customtranslator.ai и создайте с их помощью собственную систему Если у вас есть документы на корейском языке, которые соответствуют терминологии и стилю, которых вы хотите достичь, без соответствия Engli sh, вы можете автоматически перевести их на Engli sh и добавить в учебный материал в виде параллельных документов. Не используйте автоматически переведенные документы в другом направлении.

Словарь фраз имеет ограниченную помощь, потому что не знает контекста. Это полезно только для начальной загрузки вашей пользовательской системы или для очень редких терминов, когда вы не можете найти или создать предложение.

...