Почему триплетные потери выбирают жестко отрицательные, приводит к обрушившейся модели?Это проблема градиентного взрыва? - PullRequest
0 голосов
/ 05 мая 2019

В статье:

enter image description here

Автор утверждает, что выбор жесткого негатива обычно приводит к свернутой модели, но по градиенту градиент жесткого негатива даже меньше, чем у полужесткого

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...