Тензор потока: как отфильтровать набор данных по определенным признакам (столбцам)? - PullRequest
0 голосов
/ 08 апреля 2020

У меня есть набор данных, который имеет несколько объектов (столбцов) и более 10 тысяч строк. Мне нужно сохранить только те строки, где функция cr_name равна "www.google.com". Итак, я написал следующую команду:

data_set = tf.data.TFRecordDataset(train_data_files, buffer_size=10000000, num_parallel_reads=16)

data_set = data_set.filter(lambda x: x['cr_name'] == 'www.google.com')

Но это приводит к ошибке для второй команды:

TypeError: Only integers, slices (`:`), ellipsis (`...`), tf.newaxis (`None`) and scalar tf.int32/tf.int64 tensors are valid indices, got 'cr_name'

Я изменил вторую команду на следующую, но ту же ошибку Появится

data_set = data_set.filter(lambda x: tf.equal(x['cr_name'], 'www.google.com')) 

Не могли бы вы дать мне несколько советов, чтобы исправить это? Или вы могли бы научить меня, как правильно писать код? Я застрял здесь в течение долгого времени, и в Интернете мало информации. Очень ценю это.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...