Есть ли причина не всегда использовать leaky_relu - PullRequest
0 голосов
/ 16 июня 2020

Мне кажется, что активация Relu часто бывает чрезвычайно эффективной. А утечка relu решает ее главный недостаток (умирающие блоки).

Так, за исключением выходных слоев, требующих tanh, soft max или sigmoid. Есть ли причина, по которой я не хотел бы использовать дырявое реле? (Я знаю, что relu в вычислительном отношении быстрее, чем дырявый relu, но на лучшую модель стоит потратить немного больше времени)

1 Ответ

0 голосов
/ 16 июня 2020

Для большинства приложений подойдёт leaky_relu, но есть допустимые альтернативы. Имейте в виду, что даже у leaky_relu есть свои недостатки, например, необходимость настройки нового параметра alpha.

Эта статья объясняет различные альтернативы стандартному ReLU и дает плюсы и минусы для каждого из них. :

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...