Путаница в отношении рабочего механизма активации функции - PullRequest
0 голосов
/ 17 июня 2019

Для двоичной классификации независимо от используемой модели, сигмовидная функция является хорошим выбором для выходного слоя, потому что фактическое выходное значение 'Y' равно 0 или 1, поэтому имеет смысл, чтобы прогнозируемое выходное значение было числом от 0 до1.

Моя путаница заключается в том, что в выходном слое есть двоичная ступенчатая функция, которая сводит значения линейной комбинации весов и входных данных к 0 или 1?Всегда ли классификация означает применение функции определения порога поверх линейной или нелинейной функции, которая находится в скрытом слое?

Скажем, прогнозируемое выходное значение равно 0,75, а фактическое Y равно 0. Тогда как 0,75конвертируется в 1?Функция потерь рассчитывает ошибку как фактическую - прогнозируемую = 0-0,75 = -0,75

Может кто-нибудь объяснить, пожалуйста, математику или указать некоторые ссылки, где показаны рабочие шаги?Спасибо.

1 Ответ

0 голосов
/ 17 июня 2019

Один из способов думать о результате - это вероятность.Для биномиального классификатора, объединившего все, что он видит как spam или not_spam, результаты можно интерпретировать как вероятность того, что данные являются спамом.Чтобы выразить это байесовским способом:

P(email=spam|words)

Мы можем использовать пороговую функцию в выходном слое, если у нас есть задача двоичной классификации.Выбор функции активации остается за вами, и каждая функция активации имеет разные пороговые значения.Поэтому, если вы установите его на 0,5 (выбрав сигмоид), все, что ниже, будет выходом 0 (spam), а все, что выше, будет выходом 1 (not_spam).

В случае нескольких-классификации, мы можем использовать обобщение кодирования One-vs-All / one-hot.

Источник здесь

...