Причиной несоответствия является то, что ваши переменные инициализируются различными значениями.Это можно увидеть, позвонив:
print(sess.run(tf.trainable_variables()))
после того, как они были инициализированы.
Причина этой несоответствия в том, что существует глобальное начальное число и начальное число для операции, поэтому настройкаСлучайное начальное число не заставляет вызов инициализатора, скрытого в коде lstm, использовать тот же случайный начальный размер.Обратитесь к этому ответу для получения более подробной информации по этому .Подводя итог: случайное начальное число, используемое для чего-либо случайного, начинается с вашего глобального начального числа, а затем зависит от идентификатора последней операции, добавленной к графику.
Зная это, мы можем заставить переменное начальное число бытьТо же самое для обеих реализаций путем построения графика в одном и том же порядке до тех пор, пока мы не создадим переменные: это означает, что мы начали с одного и того же глобального начального числа и добавили одни и те же операции к графику в том же порядке вплоть до переменных, таким образом,переменные будут иметь одинаковое начальное значение операции.Мы можем сделать это следующим образом:
tf.reset_default_graph()
tf.set_random_seed(42)
lstm_cell = tf.nn.rnn_cell.LSTMCell(5)
inputs_shape = (3, None, 3)
lstm_cell.build(inputs_shape)
Нужен метод сборки, поскольку именно он фактически добавляет переменные в граф.
Вот полная рабочая версия того, что у вас было:
import tensorflow as tf
import numpy as np
X = np.array([[[1.1, 2.2, 3.3], [4.4, 5.5, 6.6], [0.0, 0.0, 0.0]], [[1.1, 2.2, 3.3], [4.4, 5.5, 6.6], [7.7, 8.8, 9.9]], [[1.1, 2.2, 3.3], [0.0, 0.0, 0.0], [0.0, 0.0, 0.0]]], dtype=np.float32)
X_len = np.array([2, 3, 1], dtype=np.int32)
def dynamic():
tf.reset_default_graph()
tf.set_random_seed(42)
lstm_cell = tf.nn.rnn_cell.LSTMCell(5)
inputs_shape = (3, None, 3)
lstm_cell.build(inputs_shape)
inputs = tf.placeholder(shape=inputs_shape, dtype=tf.float32)
lengths = tf.placeholder(shape=(None,), dtype=tf.int32)
outputs, state = tf.nn.dynamic_rnn(inputs=inputs, sequence_length=lengths, cell=lstm_cell, dtype=tf.float32,
initial_state=lstm_cell.zero_state(3, dtype=tf.float32), time_major=True)
outputs_reshaped = tf.transpose(outputs, perm=[1, 0, 2])
sess = tf.Session()
sess.run(tf.initializers.global_variables())
a = np.transpose(X, (1, 0, 2))
hidden_state = sess.run(outputs_reshaped, feed_dict={inputs: a, lengths: X_len})
print(hidden_state)
def replicated():
tf.reset_default_graph()
tf.set_random_seed(42)
lstm_cell = tf.nn.rnn_cell.LSTMCell(5)
inputs_shape = (3, None, 3)
lstm_cell.build(inputs_shape)
inputs = tf.placeholder(shape=inputs_shape, dtype=tf.float32)
lengths = tf.placeholder(shape=(None,), dtype=tf.int32)
inputs_ta = tf.TensorArray(dtype=tf.float32, size=3)
inputs_ta = inputs_ta.unstack(inputs)
def loop_fn(time, cell_output, cell_state, loop_state):
emit_output = cell_output # == None for time == 0
if cell_output is None: # time == 0
next_cell_state = lstm_cell.zero_state(3, tf.float32)
else:
next_cell_state = cell_state
elements_finished = (time >= lengths)
finished = tf.reduce_all(elements_finished)
next_input = tf.cond(finished, true_fn=lambda: tf.zeros([3, 3], dtype=tf.float32),
false_fn=lambda: inputs_ta.read(time))
next_loop_state = None
return (elements_finished, next_input, next_cell_state, emit_output, next_loop_state)
outputs_ta, final_state, _ = tf.nn.raw_rnn(lstm_cell, loop_fn)
outputs_reshaped = tf.transpose(outputs_ta.stack(), perm=[1, 0, 2])
sess = tf.Session()
sess.run(tf.initializers.global_variables())
a = np.transpose(X, (1, 0, 2))
hidden_state = sess.run(outputs_reshaped, feed_dict={inputs: a, lengths: X_len})
print(hidden_state)
if __name__ == '__main__':
dynamic()
replicated()