Question

Мне кажется, что активация Relu часто бывает чрезвычайно эффективной. А утечка relu решает ее главный недостаток (умирающие блоки).

Так, за исключением выходных слоев, требующих tanh, soft max или sigmoid. Есть ли причина, по которой я не хотел бы использовать дырявое реле? (Я знаю, что relu в вычислительном отношении быстрее, чем дырявый relu, но на лучшую модель стоит потратить немного больше времени)

HitLuca · Answer 1 · 16 июня 2020

Для большинства приложений подойдёт leaky_relu, но есть допустимые альтернативы. Имейте в виду, что даже у leaky_relu есть свои недостатки, например, необходимость настройки нового параметра alpha.

Эта статья объясняет различные альтернативы стандартному ReLU и дает плюсы и минусы для каждого из них. :

Есть ли причина не всегда использовать leaky_relu

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Есть ли причина не всегда использовать leaky_relu

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы