tf.gradients () можно использовать для получения градиентов неизвестных параметров.
В RNN градиенты суммируются для каждого временного шага, а сумма градиентов для каждого временного шага - это то, что возвращает tf.gradients ()
Как получить градиенты на каждом временном шаге RNN?
И какая часть кода делает backprop для RNN.