Я загрузил свои документы (двуязычные документы), которые включают более 13 000 предложений. Но результат обучения ... только 60% предложений были выровнены и 40% предложений были использованы для обучения. Таким образом, используется только 5000 предложений.
При загрузке я использовал один двуязычный файл для исходного и целевого файла. Эта проблема вызвана низким количеством выровненных и использованных предложений? эти файлы на самом деле являются результатом перевода человеком.
Сколько предложений следует использовать для успешного обучения?
Если я успешно пройду обучение, как обычно это качество по сравнению с машинным переводом Google?