Как полностью связанный слой после глобального среднего пула работает в Resnet50? - PullRequest
0 голосов
/ 02 февраля 2019

У меня есть сеть resnet50 с верхними слоями, которые включают глобальное среднее пул с формой (1, 2048) и плотный слой с использованием softmax с формой (1, 3).Как форма вывода (1,2048) в среднем глобальном пуле становится (1, 3) для выхода плотного слоя?Как это работает?Я не могу найти надежный источник, чтобы объяснить это

1 Ответ

0 голосов
/ 02 февраля 2019

Плотные или полностью связанные слои - это просто матричное умножение (со смещением).Итак, что вы делаете, это умножаете матрицу с формой 1x2048 на другую матрицу формы 2048x3, чтобы получить выходную матрицу формы 1x3, которая дает вам баллы за ваши 3 класса.Softmax преобразует эти оценки в вероятность.Конечно, ваша сеть узнает вес этих матриц, используя обратное распространение.

...