Question

У меня один и тот же вопрос для tf.contrib.rnn.LSTMBlockCell и tf.contrib.cudnn_rnn.CudnnCompatibleLSTMCell:

Как правильно инициализировать веса LSTM из числовых массивов?Выполняется следующий фрагмент кода, но, похоже, он не выполняет то, что мне нужно:

train_data = np.load('mnist_train_data.npy').reshape(-1,28,28)
train_label = np.load('mnist_train_label.npy')

params = [np.random.randn(28+128, 4*128), np.zeros(4*128)]

X = tf.placeholder(tf.float32, shape=[54999, 28, 28])
y = tf.placeholder(tf.int64, None)
state = LSTMStateTuple(*(tf.zeros((54999, 128), dtype=tf.float32) for _ in range(2)))

cell = tf.contrib.rnn.LSTMBlockCell(128)
cell.build(tf.TensorShape((None, 28)))
cell.set_weights(params)

initial_weights = cell.get_weights()

print(np.array_equal(params[0], initial_weights[0]))

w1 = tf.Variable(np.random.randn(128, 10), dtype=tf.float32)
b1 = tf.Variable(np.zeros(10), dtype=tf.float32)

full_seq, current_state = tf.nn.dynamic_rnn(cell, X, initial_state=state, dtype=tf.float32)
output = tf.matmul(current_state[1], w1)
output += b1
loss = tf.losses.softmax_cross_entropy(y, output)

train_step = tf.train.AdamOptimizer(0.01).minimize(loss)

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    for i in range(1):
        feed_dict = {X: train_data, y: train_label}
        sess.run(train_step, feed_dict=feed_dict)

final_weights = cell.get_weights()

print(np.array_equal(initial_weights[0], final_weights[0]))

Это выводит False в первом операторе печати, поэтому на самом деле кажется, что пустые массивыбыть использованы в качестве весов.

Более того, после сеанса обучения это выводит True, что подразумевает, что эти веса фактически не обновляются во время обучения.

Заранее благодарим за любую помощь по предмету.

Как правильно инициализировать веса LSTM из массивов Numpy в Tensorflow?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как правильно инициализировать веса LSTM из массивов Numpy в Tensorflow?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы