Как вывести второй слой сети? - PullRequest
9 голосов
/ 23 февраля 2020

Моя модель обучена на ди git изображениях (MNIST dataset). Я пытаюсь распечатать выходные данные второго уровня моей сети - массив из 128 чисел.

После прочтения множества примеров - например, this , и this , или это .

Мне не удалось сделать это в моей собственной сети. Ни одно из решений не работает с моим собственным алгоритмом.

Ссылка на Colab: https://colab.research.google.com/drive/1MLbpWJmq8JZB4_zKongaHP2o3M1FpvAv?fbclid=IwAR20xRz2i6sFS-Nm6Xwfk5hztdXOuxY4tZaDRXxAx3b986HToa9-IaTgASU

Я получил много разных сообщений об ошибках. Я пытался справиться с каждым из них, но не мог понять это самостоятельно.

Что мне не хватает? Как вывести Второй слой? Если моя форма (28,28) - каким должен быть тип и значение input_shape?


Неудачные испытания и ошибки для пример:

(1)

for layer in model.layers:

    get_2nd_layer_output = K.function([model.layers[0].input],[model.layers[2].output])
    layer_output = get_2nd_layer_output(layer)[0]
    print('\nlayer output: get_2nd_layer_output=, layer=', layer, '\nlayer output: get_2nd_layer_output=', get_2nd_layer_output)

TypeError: входные данные должны быть списком или кортежем.

(2)

input_shape=(28, 28)
inp = model.input                                           # input placeholder
outputs = [layer.output for layer in model.layers]          # all layer outputs
functor = K.function([inp, K.learning_phase()], outputs )   # evaluation function

# Testing
test = np.random.random(input_shape)[np.newaxis,...]
layer_outs = functor([test, 0.])
print('layer_outs',layer_outs)

tenorflow. python .framework.errors_impl.FailedPreconditionError: Ошибка при чтении переменной ресурса dens_1 / bias из Container: localhost. Это может означать, что переменная была неинициализирована. Не найдено: Контейнер localhost не существует. (Не удалось найти ресурс: localhost / плотность_1 / смещение) [[{{узел плотность_1 / BiasAdd / ReadVariableOp}}]]

Ответы [ 2 ]

3 голосов
/ 25 февраля 2020

(Предполагается, что TF2)

Я думаю, что наиболее простым подходом было бы назвать ваши слои, а затем вызывать их со стандартным вводом, чтобы ваша модель могла выглядеть как

model = keras.Sequential([
    keras.layers.Flatten(input_shape=(28, 28), name='flatten'),
    keras.layers.Dense(128, activation='relu', name='hidden'),
    keras.layers.Dense(10, activation='softmax')
])

Затем просто создайте входные данные, и

my_input = tf.random.normal((1, 28, 28)) # Should be like the standard input to your network
output_of_flatten = model.get_layer('flatten')(my_input)
output_of_hidden = model.get_layer('hidden')(output_of_flatten)

output_of_hidden - это то, что вы ищете

Альтернативный подход

Если вы ищете более Общее решение, предполагая, что ваша модель последовательная, вы можете использовать ключевое слово index get_layer, например,

my_input = tf.random.normal((1, 28, 28)) # Should be like the standard input to your network
desired_index = 1  # 1 == second layer

for i in range(desired_index):
    my_input = model.get_layer(index=i)(my_input)

. В конце этого l oop my_input должно быть то, что вы ищете для

3 голосов
/ 25 февраля 2020

Похоже, вы смешиваете старые кера (до тензор потока 2.0: import keras) и новые кера (from tensorflow import keras).

Старайтесь не использовать старые keras вместе с tenorflow> = 2.0 (и не ссылаться на старую документацию, как в первой ссылке), так как ее легко спутать с новой (хотя ничего строго нелогичного):

from tensorflow import keras
from keras.models import Model
print(Model.__module__) #outputs 'keras.engine.training'

from tensorflow.keras.models import Model
print(Model.__module__) #outputs 'tensorflow.python.keras.engine.training'

Поведение будет очень нестабильным, смешивая эти две библиотеки.

Как только это будет сделано, используя ответ из того, что вы пытались, m в качестве вашей модели и my_input_shape в качестве формы ваших моделей введите ie в форме одного изображения (здесь (28, 28) или (1, 28, 28), если у вас есть партии):

from tensorflow import keras as K
my_input_data = np.random.rand(*my_input_shape) 
new_temp_model = K.Model(m.input, m.layers[3].output) #replace 3 with index of desired layer
output_of_3rd_layer = new_temp_model.predict(my_input_data) #this is what you want

Если у вас есть одно изображение img, вы можете написать прямо new_temp_model.predict(img)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...