Я пытаюсь реализовать вложенный RNN с помощью RNNcell, который содержит уровень RNN. В этом случае я помещаю слой GRU внутрь RNNcell. Модель может быть обучена и сохранена в обычном режиме, но когда я загружаю модель с использованием графического процессора, она выдает ошибку «Нет колокейшн узлов и устройств во время операции». Однако, если я загружаю тот же файл с использованием процессора, он может успешно загружаться и переучиваться. Следовательно, эта модель может обучаться только на графическом процессоре только один раз, и после этого ей необходимо загружать или обучать только с использованием процессора.
- Tensorflow-GPU 1.15.0
- CUDA V10.0.130
- python 3.6.5
- Keras 2.3.1
- Keras-Applications 1.0.8
- Keras-Preprocessing 1.1.0
Это то, что я пробовал.
- загрузить только вес (сбой)
- загрузить всю модель с помощью графического процессора (сбой)
- загрузить всю модель с помощью процессора (успех)
- загрузить json модель + вес с использованием графического процессора (сбой)
- нагрузка json модель + вес с использованием процессорного процессора (успех)
import numpy as np
import keras
import tensorflow as tf
from keras.layers import Input, GRU, RNN
from keras.models import Model, load_model, model_from_json
import keras.backend as K
import time
lookback = 10
input_feature = 7
latent_dim = 9
number_of_point = 10
# simple nested Rnn cell
class SystemCell(keras.layers.Layer):
def __init__(self, latent,size=7, **kwargs):
super(SystemCell, self).__init__(**kwargs)
self.state_size = size
self.latent = latent
self.gru_layer = GRU(self.latent, activation='relu', return_state=False, return_sequences=True, name='GRU_Inside')
def call(self, inputs, states):
prev_action = states[0]
# state representation
input = K.reshape(inputs,(-1,10,7))
gru_state = self.gru_layer(input)
# Debug
output = prev_action
output2 = gru_state
return output2, [output]
def get_config(self):
config = super(SystemCell, self).get_config()
config['latent'] = self.latent
return config
# some random tasting loss
def los(y_true, y_pred):
return tf.reduce_sum(tf.reduce_sum(y_pred,axis=-1),-1) - y_true
# testing data
output = np.ones(shape=(2,10))
data = np.ones(shape=(2,10,input_feature*lookback))
# '''
# create model, train, and save model
with tf.device('/gpu:0'):
# set up model
in1 = Input(shape=(number_of_point,input_feature*lookback))
out = RNN(SystemCell(latent_dim), return_sequences=True)(in1)
M =Model(inputs=[in1], outputs=[out])
M.compile(keras.optimizers.Adam(learning_rate=0.001), loss=los)
# train
t = time.time()
M.fit(x=data, y=output, batch_size=2, epochs=10)
# save model
model_json = M.to_json()
with open("testgru.json", "w") as json_file:
# serialize weights to HDF5
print("Saved model to disk")
tf.summary.FileWriter('./log/', tf.get_default_graph())
# '''
# del M
# case1 load only weight
with tf.device('/gpu:0'):
in1 = Input(shape=(number_of_point,input_feature*look))
out = RNN(SystemCell(latent_dim), return_sequences=True)(in1)
M =Model(inputs=[in1], outputs=[out])
M.compile(keras.optimizers.Adam(learning_rate=0.001), loss=los)
M.fit(x=data, y=output, batch_size=2, epochs=100)
# '''
# error log
[[node rnn_2/while/GRU_Inside/while/Identity_1 (defined at D:\Program Files\Python36\lib\site-packages\tensorflow_core\python\framework\ops.py:1748) ]]Additional information about colocations:No node-device colocations were active during op 'rnn_2/while/GRU_Inside/while/Identity_1' creation.
Device assignments active during op 'rnn_2/while/GRU_Inside/while/Identity_1' creation:
with tf.device(/gpu:0):
# case2 load whole model using gpu
with tf.device('/gpu:0'):
# '''
ob = {'SystemCell': SystemCell,
'los': los}
M = load_model('testgru.h5', ob)
M.fit(x=data, y=output, batch_size=2, epochs=100)
# error log ( same as case1)
# '''
# case3 load whole model using cpu (success)
with tf.device('/cpu:0'):
ob = {'SystemCell': SystemCell,
'los': los}
M = load_model('testgru.h5', ob)
M.fit(x=data, y=output, batch_size=2, epochs=10)
# '''
# case3 load json model + weight using gpu
with tf.device('/gpu:0'):
ob = {'SystemCell': SystemCell}
json_file = open('testgru.json', 'r')
loaded_model_json = json_file.read()
M = model_from_json(loaded_model_json, custom_objects=ob)
M.compile(keras.optimizers.Adam(learning_rate=0.001), loss=los)
M.fit(x=data, y=output, batch_size=2, epochs=10)
# error log same as case 1
# case3 load json model + weight using cpu (success)
with tf.device('/cpu:0'):
ob = {'SystemCell': SystemCell}
json_file = open('testgru.json', 'r')
loaded_model_json = json_file.read()
M = model_from_json(loaded_model_json, custom_objects=ob)
M.compile(keras.optimizers.Adam(learning_rate=0.001), loss=los)
M.fit(x=data, y=output, batch_size=2, epochs=10)
# '''