Я пытаюсь вычислить флоп модели GRU за один шаг. Я понимаю все результаты, но не ГРУ / время. Почему TensorFlow нужно создавать gru / в то время как в графе удваиваются вычисления? Большое спасибо за вашу помощь !!!! Вот мой график тензорной доски, коды и результаты флопа:
inputs = tf.placeholder('float32', shape=(1,1,512))
x = tf.keras.layers.GRU(512, activation='tanh', bias_initializer=Constant(value=0), kernel_initializer=Constant(value=1), recurrent_initializer=Constant(value=1))(inputs)
flops = tf.profiler.profile(graph, options=tf.profiler.ProfileOptionBuilder.float_operation())
params = tf.profiler.profile(graph, options=tf.profiler.ProfileOptionBuilder.trainable_variables_parameter())
data:image/s3,"s3://crabby-images/da4fc/da4fc4a1467e5bad84cc0758af93b2244fbb7573" alt="enter image description here"