Сбой вычисления градиентов keras "Неверный индекс из измерения: 3, 0, C" - PullRequest
0 голосов
/ 19 апреля 2019

Когда я пытаюсь вычислить градиент X по отношению к Y (на самом деле не имеет значения, что такое X и Y) в сети со слоем conv1d, я получаю сообщение «Неверный индекс из измерения: 3, 0, С "и процесс умирает.

Минимальный рабочий пример:

import numpy as np

from tensorflow.python.keras import models
from tensorflow.python.keras import layers
from tensorflow.python.keras import backend as K

inp = layers.Input(shape=(10, 20,))
conv = layers.Conv1D(filters=10, kernel_size=2)(inp)
pool = layers.GlobalMaxPool1D()(conv)
output = layers.Dense(1, activation="sigmoid")(pool)

m = models.Model(inp, output)

m.summary()

m.compile(optimizer="adam", loss="binary_crossentropy")

Кажется, работает:

m.fit(x=np.random.randn(100, 10, 20), y=np.random.randn(100))

Это перерывы:

loss = K.mean(m.output)
grads = K.gradients(loss, m.input)[0]
f = K.function([m.input], [grads])
print(f([np.random.randn(10, 20)]))

My python, keras, tf версии:

import tensorflow as tf
import sys
from tensorflow.python import keras

print(tf.__version__)
print(keras.__version__)
print(sys.version)

1.12.0
2.1.6-tf
3.6.7 |Anaconda, Inc.| (default, Oct 23 2018, 14:01:38) 
[GCC 4.2.1 Compatible Clang 4.0.1 (tags/RELEASE_401/final)]

На самом деле не имеет значения, из чего я вычисляю градиент относительно чего ... Сообщение об ошибке

2019-04-19 17:00:58.249788: F ./tensorflow/core/util/tensor_format.h:420] Check failed: index >= 0 && index < dimension_attributes.size() Invalid index from the dimension: 3, 0, C

Я вижу, что он связан со слоем conv 1d, основанным на сообщении об ошибке, но я не совсем понимаю, чего мне здесь не хватает. Спасибо за любые подсказки.

1 Ответ

1 голос
/ 20 апреля 2019

Краткий ответ: несовместимость формы, измените вызов на: f([np.random.randn(1, 10, 20)]).

Длинный ответ: Поскольку вы установили форму ввода как (10, 20,), это означает, что каждая входная выборка имеет форму (10,20).Однако вы также должны отметить, что модели Keras ожидают в качестве входных данных серию выборок .Следовательно, в этом случае ожидается массив с 3 измерениями, где первое измерение указывает размерность пакета.Поскольку вы хотите передать модели один образец, входной массив должен иметь форму (1, 10, 20).Таким образом, вы должны изменить форму в функции randn соответственно:

f([np.random.randn(1, 10, 20)])
                   ^
                   |
                   |
              batch dimension
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...