Darome 07 августа 2020 200

2 в позиционном кодировании в учебнике по тензорному потоку о трансформаторах

Darome / 07 августа 2020

Я реализовал архитектуру трансформатора в тензорном потоке.

Они реализуют позиционное кодирование следующим образом:

angle_rates = 1 / np.power(10000, (2 * (i//2)) / np.float32(d_model))

Однако в статье i не делится на 2 (i // 2), это ошибка? , или зачем делать эту операцию?

Спасибо

...

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.