Разрешить взрыв градиента в VAE - PullRequest
0 голосов
/ 19 апреля 2019

Как разрешить взрывной градиент в глубокой генеративной модели (VAE)?

Примечание: набор данных содержит много значений NaN в столбцах

1 Ответ

0 голосов
/ 20 апреля 2019

Я не уверен, что градиенты взрыва являются типичными для VAE. Это может быть другая проблема в вашем коде. Однако взрывные градиенты обычно решаются с помощью градиентного отсечения:

weights = weights*clipping_threshold/l2_norm(weights)

Где clipping_threshold равен 1.

...