У меня есть функция ввода, которая читает все строки из аргумента имени файла.Затем он применяет функцию парсера к каждой строке.Каждая строка в моем файле .csv выглядит следующим образом: "path_to_img, label_num".Вот код:
def input_fn(filename):
def parser(column):
d = tf.decode_csv(column, record_defaults=[[''], [-1]])
img, label = d
img = tf.read_file(img)
img = tf.image.decode_jpeg(img, channels=3)
img = tf.image.resize_images(img, (300, 200))
img = tf.cast(img, tf.float32)
return {'image': img}, label
dataset = tf.data.TextLineDataset(filename).map(parser)
dataset = dataset.repeat(None).shuffle(5000).batch(500)
return dataset.make_one_shot_iterator().get_next()
Затем я создаю классификатор и тренируюсь:
feat_cols = [tf.feature_column.numeric_column('image', shape=(300, 200))]
model = tf.estimator.DNNClassifier([4028, 1024, 512], feature_columns=feat_cols, model_dir=OUTDIR, n_classes=5)
model.train(input_fn=lambda: input_fn('data.csv'), steps=1000)
Но в итоге я получаю сообщение об ошибке, касающееся операции декодирования, и все еще не могу понять, в чем дело
tensorflow.python.framework.errors_impl.InvalidArgumentError: Expected image (JPEG, PNG, or GIF), got unknown format starting with '\"\"\"\n flickr.p'
[[Node: DecodeJpeg = DecodeJpeg[acceptable_fraction=1, channels=3, dct_method="", fancy_upscaling=true, ratio=1, try_recover_truncated=false](ReadFile)]]
[[Node: IteratorGetNext = IteratorGetNext[output_shapes=[[?,300,200,1], [?]], output_types=[DT_FLOAT, DT_INT32], _device="/job:localhost/replica:0/task:0/device:CPU:0"](OneShotIterator)]]