Я пытаюсь получить значение градиента из слоя 'layer14 / pointwise_conv' YA MNET.
Для начала я просто открыл репозиторий , чтобы вы могли легко увидеть тот же самый код, с которым я борюсь.
YA MNET содержит mel_spe c извлечение и кадрирование функции в структуре tf_model.
(например, аудиофайл, включенный в проект, имеет длину 10 секунд и преобразуется в данные 19-framed-mel_spe c во время обработки)
Поэтому я собирался получить grads_val для каждого кадра, например,
y_c = yamnet.output[0][0, prediction.argmax()]
conv_output = yamnet.get_layer('layer14/pointwise_conv').output
grads = K.gradients(y_c, conv_output)[0]
gradient_function = K.function([yamnet.input], [conv_output, grads])
output, grads_val = gradient_function([INPUT_IMAGE])
, но только первый кадр был обработан правильно.

Как рассчитать градиенты каждого кадра?