Как выбрать количество сверточных слоев и фильтров в CNN - PullRequest
0 голосов
/ 25 февраля 2020

Я пытаюсь увеличить скорость моей модели CNN, метод, который я использовал, удаляет некоторые слои свертки в архитектуре, и точность модели практически не меняется с моим набором данных.

I Мне интересно, есть ли какой-нибудь метод для анализа того, сколько слоев свертки достаточно для набора данных, прежде чем обучать модель? И есть ли другие методы для анализа, сколько фильтров достаточно для модели? ep

1 Ответ

0 голосов
/ 25 февраля 2020

Давайте сначала начнем с более простой части. Знать количество входных и выходных слоев и количество их нейронов - самая простая часть. Каждая сеть имеет один входной слой и один выходной слой. Количество нейронов во входном слое равно количеству входных переменных в обрабатываемых данных. Количество нейронов в выходном слое равно количеству выходов, связанных с каждым входом. Но задача состоит в том, чтобы узнать количество скрытых слоев и их нейронов.

Ответ заключается в том, что вы не можете аналитически рассчитать количество слоев или количество узлов, которые нужно использовать на слой в искусственной нейронной сети для решения конкретной проблемы c реальная задача прогнозного моделирования. Количество слоев и количество узлов в каждом слое являются гиперпараметрами модели, которые вы должны указать и изучить. Вы должны найти ответ, используя надежный тестовый комплект и контролируемые эксперименты. Независимо от эвристики, с которой вы можете столкнуться, все ответы вернутся к необходимости тщательного экспериментирования, чтобы увидеть, что лучше всего подходит для вашего указанного c набора данных.

Например, размер фильтра - один из таких гиперпараметров, который вы следует указать перед тренировкой вашей сети.
Для проблемы распознавания изображений, если вы считаете, что для распознавания объекта сетью необходимо большое количество пикселей, вы будете использовать большие фильтры (например, 11x11 или 9x9). Если вы думаете, что отличает объекты от небольших и локальных особенностей, вы должны использовать маленькие фильтры (3x3 или 5x5). Это несколько советов, но не существует каких-либо правил.

Существует множество хитростей, позволяющих повысить точность вашей модели глубокого обучения. Пожалуйста, обратитесь к этой ссылке Улучшение производительности модели глубокого обучения .

Надеюсь, это поможет вам.

...