Первый аргумент - это маскированный вход, аргумент masked_lm_labels
- требуемый.
input_ids
должен быть замаскирован. В общем, это зависит от вас, как вы делаете маскировку. В исходном BERT они выбирают 15% токенов и следующие с ними, либо
- Использование
[MASK]
токенов; или - Используйте случайный токен; или
- Сохранить исходный токен без изменений.
Это изменяет входные данные, поэтому вам нужно указать вашей модели, какой исходный немаскированный входной сигнал является аргументом masked_lm_labels
. Также обратите внимание, что вы не хотите вычислять потери только для токенов, которые были фактически выбраны для маскировки. Остальные токены должны быть заменены индексом -100
.
Для получения более подробной информации, см. Документацию .