Почему tf.executing_eagerly () возвращает False в TensorFlow 2? - PullRequest
1 голос
/ 22 апреля 2020

Позвольте мне объяснить мои настройки. Я использую TensorFlow 2.1, версию Keras, поставляемую с TF, и TensorFlow Probability 0.9.

У меня есть функция get_model, которая создает (с функциональным API) и возвращает модель с использованием Keras и пользовательских слоев. В методе __init__ этих пользовательских слоев A я вызываю метод A.m, который выполняет инструкцию print(tf.executing_eagerly()), но возвращает False. Почему?

Если быть более точным, это примерно моя установка

def get_model():
    inp = Input(...)
    x = A(...)(inp) 
    x = A(...)(x)
    ...
    model = Model(inp, out)
    model.compile(...)
    return model

class A(tfp.layers.DenseFlipout): # TensorFlow Probability
    def __init__(...):
        self.m()

    def m(self): 
        print(tf.executing_eagerly()) # Prints False

Документация tf.executing_eagerly говорит

Eager выполнение включено по умолчанию, и этот API возвращает True в большинстве случаев. Однако этот API может возвращать значение False в следующих случаях использования.

  • Выполнение внутри tf.function, если только не вызывается tf.init_scope или tf.config.experimental_run_functions_eagerly(True).
  • Выполнение внутри вызывается функция преобразования для tf.dataset.
  • tf.compat.v1.disable_eager_execution().

Но это не мой случай, поэтому tf.executing_eagerly() должен вернуть True в моем случае дело, но нет. Почему?

Вот простой полный пример (в TF 2.1), который иллюстрирует проблему.

import tensorflow as tf


class MyLayer(tf.keras.layers.Layer):
    def call(self, inputs):
        tf.print("tf.executing_eagerly() =", tf.executing_eagerly())
        return inputs


def get_model():
    inp = tf.keras.layers.Input(shape=(1,))
    out = MyLayer(8)(inp)
    model = tf.keras.Model(inputs=inp, outputs=out)
    model.summary()
    return model


def train():
    model = get_model()
    model.compile(optimizer="adam", loss="mae")
    x_train = [2, 3, 4, 1, 2, 6]
    y_train = [1, 0, 1, 0, 1, 1]
    model.fit(x_train, y_train)


if __name__ == '__main__':
    train()

Этот пример печатает tf.executing_eagerly() = False.

См. связанная с Github проблема .

1 Ответ

0 голосов
/ 25 апреля 2020

Насколько я знаю, когда вход на пользовательский слой имеет символьный c ввод, тогда слой выполняется в графическом (не нетерпеливом) режиме. Тем не менее, если ваш ввод в пользовательский слой является нетерпеливым тензором (как в следующем примере # 1, то пользовательский слой выполняется в нетерпеливом режиме. Таким образом, ожидается вывод вашей модели tf.executing_eagerly() = False.

Пример # 1

from tensorflow.keras import layers


class Linear(layers.Layer):

  def __init__(self, units=32, input_dim=32):
    super(Linear, self).__init__()
    w_init = tf.random_normal_initializer()
    self.w = tf.Variable(initial_value=w_init(shape=(input_dim, units),
                                              dtype='float32'),
                         trainable=True)
    b_init = tf.zeros_initializer()
    self.b = tf.Variable(initial_value=b_init(shape=(units,),
                                              dtype='float32'),
                         trainable=True)

  def call(self, inputs):
    print("tf.executing_eagerly() =", tf.executing_eagerly())
    return tf.matmul(inputs, self.w) + self.b

x = tf.ones((1, 2)) # returns tf.executing_eagerly() = True
#x = tf.keras.layers.Input(shape=(2,)) #tf.executing_eagerly() = False
linear_layer = Linear(4, 2)
y = linear_layer(x)
print(y) 
#output in graph mode: Tensor("linear_9/Identity:0", shape=(None, 4), dtype=float32)
#output in Eager mode: tf.Tensor([[-0.03011466  0.02563028  0.01234017  0.02272708]], shape=(1, 4), dtype=float32)

Вот еще один пример с функциональным API-интерфейсом Keras, в котором использовался пользовательский слой (аналогичный вам). Эта модель выполняется в графическом режиме и печатает tf.executing_eagerly() = False, как в вашем случае.

from tensorflow import keras
from tensorflow.keras import layers
class CustomDense(layers.Layer):
  def __init__(self, units=32):
    super(CustomDense, self).__init__()
    self.units = units

  def build(self, input_shape):
    self.w = self.add_weight(shape=(input_shape[-1], self.units),
                             initializer='random_normal',
                             trainable=True)
    self.b = self.add_weight(shape=(self.units,),
                             initializer='random_normal',
                             trainable=True)

  def call(self, inputs):
    print("tf.executing_eagerly() =", tf.executing_eagerly())
    return tf.matmul(inputs, self.w) + self.b


inputs = keras.Input((4,))
outputs = CustomDense(10)(inputs)

model = keras.Model(inputs, outputs) 
...