Tensorflow TFDV не работает с изображениями - PullRequest
0 голосов
/ 13 декабря 2018

Я пытаюсь заставить TFDV работать с изображениями RGB в качестве входов функций, читая из файла TFRecords.Я могу читать / записывать данные изображения в файлы TFRecord нормально.Вот соответствующие фрагменты кода для записи, где img - массив numpy [32,32,3]:

feature = {'train/label': _int64_feature(y_train[i]),
           'train/image': _bytes_feature(tf.compat.as_bytes(img.tostring()))
          }

И чтение назад:

read_features = {'train/label': tf.FixedLenFeature([], tf.int64),
             'train/image': tf.FixedLenFeature([], tf.string)}

Затем я могу использовать frombuffer иизмените форму, чтобы вернуть мое изображение правильно.

Проблема в том, что когда я запускаю tfdv.generate_statistics_from_tfrecord (), используя этот файл TFRecords.Выдает ошибку:

ValueError: '\xff ...... \x87' has type str, but isn't valid UTF-8 encoding. Non-UTF-8 strings must be converted to unicode objects before being added. [while running 'GenerateStatistics/RunStatsGenerators/TopKStatsGenerator/TopK_ConvertToSingleFeatureStats']

Я пробовал все виды различных способов написания изображений, используя astype (Unicode) и многое другое, но я не могу этого добиться.

Есть идеи, пожалуйста?

Спасибо, Пол

...