Я пытаюсь реализовать модель внимания, но не могу выполнить matmul
torch.matmul(att, v)
Форма att и v:
att shape:torch.Size([20, 3, 128, 128])
v shape:torch.Size([20, 3, 128, 100])
я получаю такую ошибку :
RuntimeError: Ожидаемый тензор будет иметь размер 100 в измерении 1, но получил размер 128 для аргумента # 2 'batch2' (при проверке аргументов для bmm)
I также попытался создать два тензора с одинаковой формой с помощью torch.randn и повторить ту же операцию, и ошибки не возникло. Я не знаю, что делает такую ошибку