Question

Существуют ли в Deep Learning какие-либо правила или передовые практики для использования одной и той же функции активации во всех ожидаемых слоях для выходного слоя.

Например, если я использую ReLu в одном слое, есть ли какое-либо правило или наилучшая практика использования Relu во всей сети, или я могу использовать Tan или любую другую функцию активации?

penkovsky · Answer 1 · 22 марта 2019

В целом, ReLU может ускорить процесс конвергенции вашей сети.Смотрите также этот ответ .Поэтому, если нет дополнительных соображений, вы можете придерживаться активации ReLU на всех уровнях.

Лучшие практики глубокого обучения для использования одной и той же активации на всех уровнях

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Лучшие практики глубокого обучения для использования одной и той же активации на всех уровнях

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы