Я работаю над Efficen tNet -B0. Я хочу добавить механизм внимания в мою модель.
Вывод моего conv_layer (Нет, 7,7,1280), у меня есть чтобы преобразовать его в (49,1280), а затем использовать Ui-подобный ввод слоя F C. Я знаю, что регионы - это векторы (1,1280), поэтому для каждого изображения у меня есть 49 регионов.
Как я могу это сделать? Спасибо!