Таможенное обратное распространение - PullRequest
0 голосов
/ 11 ноября 2019

Я экспериментирую с Tensorflow, и у меня возникает следующая проблема

Я хочу использовать итерацию

w_{t} := w_{t} - ag_{t-1}

, где t - время, a - это скорость обучения, а g(0) задано заранее. Поскольку градиент не является обучаемым весом, я не могу его просто инициализировать. Любые предложения приветствуются.

Спасибо

1 Ответ

0 голосов
/ 11 ноября 2019

Я не уверен, полностью ли я понимаю ваш вопрос. Почему бы не инициализировать ваш градиент (я называю это G здесь) нулевым тензором той же формы, что и w_t? Затем, если вы хотите реализовать SGD, вы можете накапливать градиент каждой выборки из случайной партии в G и, наконец, обновить свой w_t.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...