Я реализую модель нейронного машинного перевода, и для части декодера (с механизмом внимания) я хотел бы вычислить косинусное сходство для нахождения оценок. Вот функция:
оценка (a, b) = / || a || || Ь ||
В моем случае:
a = htilde_t (N, H)
b = h (S, N, H)
the output should be (S, N)
Моя путаница связана с их размерами, и я не знаю, как решить это в pytorch.