Пользовательский переводчик Microsoft - СБОЙ ОБРАБОТКИ ДАННЫХ - PullRequest
0 голосов
/ 01 апреля 2020

Я несколько раз пытался обучить «Пользовательский переводчик Microsoft» в своем словаре, но все они провалились. Когда я выбираю только «Фразовый словарь» - создание модели завершается успешно. Но когда я пытаюсь создать обучающую модель - каждый раз, когда я получаю сообщение об ошибке «СБОЙ ДАННЫХ ОБРАБОТАНО»

Мои данные словаря представляют собой набор из 40 000 русских слов и их английский sh перевод. Слова уже сопоставлены, поэтому я использую файлы .align.

В чем может быть причина этой ошибки?

1 Ответ

0 голосов
/ 01 апреля 2020

Одной из распространенных причин неудачного обучения с типом учебного документа является то, что количество параллельных предложений будет меньше минимально необходимого 10000. Для получения дополнительной информации о различных типах документов и мин / макс, пожалуйста, обратитесь к

https://docs.microsoft.com/en-us/azure/cognitive-services/translator/custom-translator/sentence-alignment

...