E-net Архитектура глубокого обучения - PullRequest
0 голосов
/ 18 января 2019

Статья доступна по ссылке:

https://arxiv.org/pdf/1606.02147.pdf

Не в состоянии понять начальный блок архитектуры Enet.

Заявление, приведенное в исследовательской статье на странице 3:

ENet начальный блок. MaxPooling выполняется с неперекрывающимися окнами 2 × 2, и свертка имеет 13 фильтров, которые суммируют до 16 карт признаков после объединения. initial block of e-net

Итак, вопрос в том, как мы получаем 16 фильтров после объединения?

1 Ответ

0 голосов
/ 19 января 2019

Давайте рассмотрим пример. Предположим, что входное изображение имеет dims как (128,128,3), теперь с конвом ((3,3),2,13), где 2 - размер шага, а 13 - номер фильтра, мы получаем вывод как (64,64,13) ( Основная операция извлечения). Теперь в правом блоке у нас есть max-pool, который возвращает вывод как (64,64,3). На concat оба выхода имеем (64,64,16).

...