Как правильно ввести форму для оценки Tensorflow? - PullRequest
0 голосов
/ 04 января 2019

Я пытаюсь построить оценщик Tensorflow для использования на SageMaker. Основная функция обучает и оценивает оценщик. Несмотря на все мои попытки, я продолжаю получать следующую ошибку:

ValueError: Вход 0 входов слоя несовместим со слоем: ожидаемый ndim = 3, найденный ndim = 2. Получена полная форма: [50, 41]

def keras_model_fn(hyperparameters):
    """keras_model_fn receives hyperparameters from the training job and returns a compiled keras model.
    The model will be transformed into a TensorFlow Estimator before training and it will be saved in a 
    TensorFlow Serving SavedModel at the end of training.

    Args:
        hyperparameters: The hyperparameters passed to the SageMaker TrainingJob that runs your TensorFlow 
                         training script.
    Returns: A compiled Keras model
    """
    model = tf.keras.models.Sequential()
    model.add(tf.keras.layers.LSTM(32, name='inputs', input_shape=( None, 41)))
    model.add(tf.keras.layers.Dense(11, activation='softmax', name='dense'))
    model.compile(loss='categorical_crossentropy',
                  optimizer='rmsprop',
                  metrics=['accuracy'])

    return model


def train_input_fn(training_dir=None, hyperparameters=None):
    # invokes _input_fn with training dataset
    dataset = tf.data.Dataset.from_tensors(({INPUT_TENSOR_NAME: x_train}, y_train))
    dataset = dataset.repeat()
    return dataset.make_one_shot_iterator().get_next()

def eval_input_fn(training_dir=None, hyperparameters=None):
    # invokes _input_fn with evaluation dataset

    dataset =  tf.data.Dataset.from_tensors(({INPUT_TENSOR_NAME: x_test}, y_test))
    return dataset.make_one_shot_iterator().get_next()

if __name__ == '__main__':
    print(x_train.shape, y_train.shape)
    tf.logging.set_verbosity(tf.logging.INFO)
    model = keras_model_fn(0)
    estimator = tf.keras.estimator.model_to_estimator(keras_model=model)
    train_spec = tf.estimator.TrainSpec(input_fn=train_input_fn, max_steps=1000)
    eval_spec = tf.estimator.EvalSpec(input_fn=eval_input_fn)
    tf.estimator.train_and_evaluate(estimator, train_spec, eval_spec)

Мои входные и выходные формы:

(52388, 50, 41) (52388, 11)

1 Ответ

0 голосов
/ 05 января 2019

from_tensors преобразовать входной тензор в один большой тензор. Например, если вы запустите приведенный ниже пример:

import tensorflow as tf

tf.enable_eager_execution()

dataset2 = tf.data.Dataset.from_tensors(
    (tf.random_uniform([52388, 50, 41], maxval=10, dtype=tf.int32),
     tf.random_uniform([52388, 11], maxval=10, dtype=tf.int32)))

for i, item in enumerate(dataset2):
    print('element: ' + str(i), item[0], item[1])

Вы заметили, что мы повторяем набор данных только один раз, в то время как мы ожидаем, что он будет повторяться 52388 раз!

Теперь предположим, что мы хотим передать этот единственный большой тензор нашей модели. Tensorflow преобразуется в [None, 1], который None является размером нашей партии. С другой стороны, вы указываете ввод модели с [None, 41], что означает, что модель ожидает ввод с формой [None, None, 41]. Следовательно, это несоответствие вызывает ошибку.

Как это исправить?

Использование from_tensor_slices.

По-прежнему выдает ошибку измерения, как ее исправить? Определите входное измерение для LSTM:

model = tf.keras.models.Sequential()
model.add(tf.keras.layers.LSTM(32, name='inputs', input_shape=(50, 41)))
model.add(tf.keras.layers.Dense(11, activation='softmax', name='dense'))
model.compile(loss='categorical_crossentropy',
              optimizer='rmsprop',
              metrics=['accuracy'])
model.compile(loss='categorical_crossentropy',
              optimizer='rmsprop',
              metrics=['accuracy'])
...