Question

Я пытаюсь преобразовать официальную базовую реализацию word2vec в Tensorflow для использования tf.Estimator.Проблема заключается в том, что функция потерь (sampled_softmax_loss или nce_loss) выдает ошибку при использовании оценщиков Tensorflow.Он прекрасно работает в оригинальной реализации.

Вот официальная базовая реализация word2vec от Tensorflow:

https://github.com/tensorflow/tensorflow/blob/master/tensorflow/examples/tutorials/word2vec/word2vec_basic.py

Вот блокнот Google Colab, где я реализовал этот код, который работает.

https://colab.research.google.com/drive/1nTX77dRBHmXx6PEF5pmYpkIVxj_TqT5I

Вот блокнот Google Colab, в котором я изменил код, чтобы он использовал Tensorflow Estimator, который не работает.

https://colab.research.google.com/drive/1IVDqGwMx6BK5-Bgrw190jqHU6tt3ZR3e

Для удобства приведен точный код из приведенной выше версии Оценщика, где я определяю model_fn

batch_size = 128
embedding_size = 128  # Dimension of the embedding vector.
skip_window = 1  # How many words to consider left and right.
num_skips = 2  # How many times to reuse an input to generate a label.
num_sampled = 64  # Number of negative examples to sample.

def my_model( features, labels, mode, params):

    with tf.name_scope('inputs'):
        train_inputs = features
        train_labels = labels

    with tf.name_scope('embeddings'):
        embeddings = tf.Variable(
          tf.random_uniform([vocabulary_size, embedding_size], -1.0, 1.0))
        embed = tf.nn.embedding_lookup(embeddings, train_inputs)

    with tf.name_scope('weights'):
        nce_weights = tf.Variable(
          tf.truncated_normal(
              [vocabulary_size, embedding_size],
              stddev=1.0 / math.sqrt(embedding_size)))
    with tf.name_scope('biases'):
        nce_biases = tf.Variable(tf.zeros([vocabulary_size]))

    with tf.name_scope('loss'):
        loss = tf.reduce_mean(
            tf.nn.nce_loss(
                weights=nce_weights,
                biases=nce_biases,
                labels=train_labels,
                inputs=embed,
                num_sampled=num_sampled,
                num_classes=vocabulary_size))

    tf.summary.scalar('loss', loss)

    if mode == "train":
        with tf.name_scope('optimizer'):
            optimizer = tf.train.GradientDescentOptimizer(1.0).minimize(loss)

        return tf.estimator.EstimatorSpec(mode, loss=loss, train_op=optimizer)

А вот где я называю оценщики обучение

word2vecEstimator = tf.estimator.Estimator(
        model_fn=my_model,
        params={
            'batch_size': 16,
            'embedding_size': 10,
            'num_inputs': 3,
            'num_sampled': 128,
            'batch_size': 16
        })

word2vecEstimator.train(
    input_fn=generate_batch,
    steps=10)

И это сообщение об ошибке, которое я получаю, когда я вызываю тренинг оценщика:

INFO:tensorflow:Calling model_fn.
---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-22-955f44867ee5> in <module>()
      1 word2vecEstimator.train(
      2     input_fn=generate_batch,
----> 3     steps=10)

/usr/local/lib/python3.6/dist-packages/tensorflow/python/estimator/estimator.py in train(self, input_fn, hooks, steps, max_steps, saving_listeners)
    352 
    353       saving_listeners = _check_listeners_type(saving_listeners)
--> 354       loss = self._train_model(input_fn, hooks, saving_listeners)
    355       logging.info('Loss for final step: %s.', loss)
    356       return self

/usr/local/lib/python3.6/dist-packages/tensorflow/python/estimator/estimator.py in _train_model(self, input_fn, hooks, saving_listeners)
   1205       return self._train_model_distributed(input_fn, hooks, saving_listeners)
   1206     else:
-> 1207       return self._train_model_default(input_fn, hooks, saving_listeners)
   1208 
   1209   def _train_model_default(self, input_fn, hooks, saving_listeners):

/usr/local/lib/python3.6/dist-packages/tensorflow/python/estimator/estimator.py in _train_model_default(self, input_fn, hooks, saving_listeners)
   1235       worker_hooks.extend(input_hooks)
   1236       estimator_spec = self._call_model_fn(
-> 1237           features, labels, model_fn_lib.ModeKeys.TRAIN, self.config)
   1238       global_step_tensor = training_util.get_global_step(g)
   1239       return self._train_with_estimator_spec(estimator_spec, worker_hooks,

/usr/local/lib/python3.6/dist-packages/tensorflow/python/estimator/estimator.py in _call_model_fn(self, features, labels, mode, config)
   1193 
   1194     logging.info('Calling model_fn.')
-> 1195     model_fn_results = self._model_fn(features=features, **kwargs)
   1196     logging.info('Done calling model_fn.')
   1197 

<ipython-input-20-9d389437162a> in my_model(features, labels, mode, params)
     33                 inputs=embed,
     34                 num_sampled=num_sampled,
---> 35                 num_classes=vocabulary_size))
     36 
     37     # Add the loss value as a scalar to summary.

/usr/local/lib/python3.6/dist-packages/tensorflow/python/ops/nn_impl.py in nce_loss(weights, biases, labels, inputs, num_sampled, num_classes, num_true, sampled_values, remove_accidental_hits, partition_strategy, name)
   1246       remove_accidental_hits=remove_accidental_hits,
   1247       partition_strategy=partition_strategy,
-> 1248       name=name)
   1249   sampled_losses = sigmoid_cross_entropy_with_logits(
   1250       labels=labels, logits=logits, name="sampled_losses")

/usr/local/lib/python3.6/dist-packages/tensorflow/python/ops/nn_impl.py in _compute_sampled_logits(weights, biases, labels, inputs, num_sampled, num_classes, num_true, sampled_values, subtract_log_q, remove_accidental_hits, partition_strategy, name, seed)
   1029   with ops.name_scope(name, "compute_sampled_logits",
   1030                       weights + [biases, inputs, labels]):
-> 1031     if labels.dtype != dtypes.int64:
   1032       labels = math_ops.cast(labels, dtypes.int64)
   1033     labels_flat = array_ops.reshape(labels, [-1])

TypeError: data type not understood

Редактировать: По запросу вот как выглядит типичный вывод для input_fn

print(generate_batch(batch_size=8, num_skips=2, skip_window=1))

(array([3081, 3081,   12,   12,    6,    6,  195,  195], dtype=int32), array([[5234],
       [  12],
       [   6],
       [3081],
       [  12],
       [ 195],
       [   6],
       [   2]], dtype=int32))

SantoshGupta7 · Answer 1 · 03 декабря 2018

Возможно, что тензоры и операции должны быть в input_fn, а не в 'model_fn'

Я нашел эту проблему # 4026, которая решила мою проблему ... Может быть, это простоЯ глуп, но было бы замечательно, если бы вы упомянули, что все тензоры и операции должны быть внутри input_fn где-то в документации.

Вы должны вызывать read_batch_examples где-то внутри input_fn, чтобы создаваемые им тензорына графике, который Estimator создает в fit ().

https://github.com/tensorflow/tensorflow/issues/8042

О, я чувствую себя идиотом!Я создавал операцию за пределами графика.Это работает сейчас, не могу поверить, что я не думал попробовать это.Большое спасибо!Это не проблема, и она была решена

https://github.com/tensorflow/tensorflow/issues/4026

Однако, по-прежнему недостаточно информации о том, что является причиной проблемы.Это всего лишь пример.

SantoshGupta7 · Answer 2 · 06 декабря 2018

Найден ответ

Ошибка ясно говорит, что у вас недопустимый тип для меток.

Вы пытаетесь передать массив NumPy вместо Tensor.Иногда Tensorflow выполняет неявное преобразование из ndarray в Tensor под капотом (поэтому ваш код работает за пределами Estimator), но в этом случае это не так.

.

Нет, официальный вкл.кормит данные из заполнителя.Заполнитель всегда является тензором, поэтому он не зависит от неявных вещей.

Но если вы напрямую вызываете функцию потерь с пустым массивом в качестве входных данных (Обратите внимание: вызов на этапе построения графа, поэтому содержимое аргумента внедряется вграфик), он МОЖЕТ работать (однако я его не проверял).

Этот код:

nce_loss (label = [1,2,3]) будет вызываться только ОДИН РАЗ в течение графикастроительство.Метки будут статически встраиваться в граф как константы и потенциально могут быть любого Tensor-совместимого типа (list, ndarray и т. Д.)

Этот код: `` `Python def model (label_input): nce_loss (label = =label_input)

оценщик (model_fun = model) .train () `` `не может встраивать переменные меток статически, поскольку их содержимое не определено во время построения графика.Поэтому, если вы кормите что-либо, кроме тензора, он выдаст ошибку.

С

https://www.reddit.com/r/MachineLearning/comments/a39pef/r_tensorflow_estimators_managing_simplicity_vs/

Итак, я использовал labels=tf.dtypes.cast( train_labels, tf.int64), и это сработало

tifi90 · Answer 3 · 29 ноября 2018

Вы используете generate_batch как переменную здесь:

word2vecEstimator.train(
    input_fn=generate_batch,
    steps=10)

Вызовите функцию с помощью generate_batch().Но я думаю, что вы должны передать некоторые значения функции.

Преобразование Tensorflow Graph для использования Estimator, получите 'TypeError: тип данных не понят' в функции потерь, используя `sampled_softmax_loss` или` nce_loss`

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Преобразование Tensorflow Graph для использования Estimator, получите 'TypeError: тип данных не понят' в функции потерь, используя `sampled_softmax_loss` или` nce_loss`

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы