Я борюсь с вычислением градиентов по классам в выходном слое классификатора ANN в кератах (tf backend). вот архитектура модели:
model = Sequential([
Dense(64, activation='relu', input_shape=(784,)),
Dense(64, activation='relu'),
Dense(10, activation='softmax'),
])
и вот как я вычисляю градиент:
outputTensor = model.output
listOfVariableTensors = model.trainable_weights[4]
gradients = k.gradients(outputTensor, listOfVariableTensors)
evaluated_gradients[0].shape
Я получил (64,10) форму, где я хочу получить (784,10). Я думаю, что проблема в списке переменных тензоров.