Как будет работать нейронная сеть с несколькими выходными классификациями? - PullRequest
0 голосов
/ 26 февраля 2019

В настоящее время я понимаю и создал простую нейронную сеть, которая решает проблему XOR.Я хочу сделать нейронную сеть для распознавания цифр.Я знаю, что используя данные MNIST, мне понадобится 784 входных нейрона, 15 скрытых нейронов и 10 выходных нейронов (0-9).

Однако я не понимаю, как сеть будет обучена и как будет работать прямая связь с несколькими выходными нейронами.

Например, если входными были пиксели для цифры 3, как сеть будет определять, какой выходной нейрон выбран и при обучении, как сеть узнает, какой нейрон должен быть связан с целевым значением.

Любая помощь будет оценена.

1 Ответ

0 голосов
/ 26 февраля 2019

Таким образом, у вас есть проблема классификации с несколькими выходами.Я предполагаю, что вы используете функцию активации softmax для выходного слоя.

Как сеть определяет, какой выходной нейрон выбран: простой, выходной нейрон с наибольшей вероятностью быть целевым классом.

Сеть будет обучена с использованием стандартного обратного распространения, того же алгоритма, который вы использовали бы только с одним выходом.

Разница только одна: функция активации.Для двоичной классификации вам нужен только один выход (например, с цифрами 0 и 1, если вероятность <0,5, тогда класс равен 0, иначе 1). </p>

Для классификации по нескольким классам вам нужен выходной узел для каждого класса;тогда сеть выберет узел с наибольшей вероятностью быть целевым классом.

...