Я играл с разницей в использовании нейрона с одним или двумя выходами для двоичной классификации.Я знаю о «большем количестве параметров и вычислений в случае двойных нейронов», но я не против подождать еще несколько часов, чтобы найти лучшую модель.Есть ли какая-то другая причина, по которой одиночный нейрон работает лучше?
Также в Keras, когда я тренирую классификатор с одним выходным узлом (конечный плотный слой), метод predict
возвращает (сигмоид в моем случае)Значение вероятности тестового изображения, принадлежащего к классу 1. Что это значит для другого класса, класса 0?Я нашел этот другой ответ , где он говорит
'Вы можете думать, что у вас есть два выхода, но один из них имеет все веса, равные нулю, и, следовательно, его выход будет всегдаравно нулю '
Значит ли это, что сеть вообще ничего не знает о другом классе?Значит ли это, что теоретически я могу обучить его только изображениям из класса 1 или мусору из класса 0?
Также в случае с одним выходным сигналом, если мне нужно установить пороговое значение, например 0,95, ядолжен делать что-то не так, верно?Или любой порог в порядке, если я получаю хорошую точность?Я не могу понять, почему это нормально, чтобы изменить пороговое значение с 0,5, потому что, если я прав, мой сигмоидальный вывод говорит, что сеть считает, что это изображение относится к классу 1 с вероятностью 90% (скажем), почему это нормальносохранить порог в 95 пк и классифицировать это изображение как принадлежащее к классу 0?
Мой вопрос может быть повсеместным, простите меня и укажите, где я могу уточнить.Спасибо!