Извините, я новичок в НЛП. Пожалуйста, потерпите меня. Скажем, у меня есть два предложения:
Французский: Le chat mange.
Engli sh: Кошка ест.
В следующем тексте я обозначу данные тренировки как кортеж (x, y)
, где x
- входные данные, а y
- аннотация.
Когда я обучаю трансформаторную сеть, могу ли я A. вводить эти два предложения синхронно в качестве обучающих данных, т.е. (Le chat mange, The cat eats)
? Или я B. использую ((Le chat mange, ), The), ((Le chat mange, The), cat), ((Le chat mange, The cat), eats)
в качестве обучающих данных?
Если это A, звучит так, будто я должен ждать, пока сеть выдаст слова одно за другим во время обучения, что было бы невозможно распараллелить. Итак, я думаю, это должен быть B?