Для двоичной классификации независимо от используемой модели, сигмовидная функция является хорошим выбором для выходного слоя, потому что фактическое выходное значение 'Y' равно 0 или 1, поэтому имеет смысл, чтобы прогнозируемое выходное значение было числом от 0 до1.
Моя путаница заключается в том, что в выходном слое есть двоичная ступенчатая функция, которая сводит значения линейной комбинации весов и входных данных к 0 или 1?Всегда ли классификация означает применение функции определения порога поверх линейной или нелинейной функции, которая находится в скрытом слое?
Скажем, прогнозируемое выходное значение равно 0,75, а фактическое Y равно 0. Тогда как 0,75конвертируется в 1?Функция потерь рассчитывает ошибку как фактическую - прогнозируемую = 0-0,75 = -0,75
Может кто-нибудь объяснить, пожалуйста, математику или указать некоторые ссылки, где показаны рабочие шаги?Спасибо.