Нет, для сопоставимости результатов важно сохранять целевую сторону данных теста нетронутой. Удаление более длинных предложений, вероятно, дало бы вам несправедливый прирост в балле BLEU, потому что все системы имеют тенденцию работать хуже при более длинных предложениях.
Если ваша модель действительно не может обрабатывать предложения, длина которых превышает 100 слов (может быть, вы можете уменьшить размер пакета?), Правильное решение вашей проблемы:
- обрезать сторону источника набора тестовых данных так, чтобы предложения имели длину не более 100 слов, не удаляйте их
- перевести измененную исходную сторону набора данных
- оценивает переводы с использованием неизменной цели стороны тестовых данных