Я генерирую записи набора данных BDD из подмножества 20000.При создании tfrecords я выбираю 1000 изображений на каждую запись, и все в порядке.
Однако, если я выберу 500 изображений для каждой записи, некоторые из них (очень редко) будут иметь тип изображения TGA (image / x-tga) или скрипт / функцию MATLAB (text / x-matlab), тогда как обычно они должны иметьимел Program (application / octet-stream) или Binary (application / octet-stream).
Почему это произошло, и означает ли это, что tfrecords повреждены?
feature = self._get_tf_feature(
picture_id, os.path.join(full_images_path, f),
m.group(2), picture_id_annotations, new_format)
example = tf.train.Example(features=feature)
writer.write(example.SerializeToString())