Разделение набора данных тензорного потока с помощью tf.data - PullRequest
0 голосов
/ 18 февраля 2019

Я хочу разделить свой набор данных изображений на train, test и validation.Я использую API tf.data, но я не знаю, как я могу использовать разделенный набор данных с tf.data?

from random import shuffle
import glob
import cv2
import numpy as np
import sys
shuffle_data = True  # shuffle the addresses before saving
data_root = 'I:/pattern/Data2/train'
# read addresses and labels from the 'train' folder
addrs = glob.glob(data_root)

# to shuffle data
if shuffle_data:
    c = list(zip(addrs,label_to_index ))
    shuffle(c)
    addrs, label_to_index  = zip(*c)

# Divide the hata into 60% train, 20% validation, and 20% test
train_addres = addrs[0:int(0.6 * len(addrs))]
train_labels = label_to_index[0:int(0.6 * len(label_to_index))]
val_addrs = addrs[int(0.6 * len(addrs)):int(0.8 * len(addrs))]
val_labels = label_to_index[int(0.6 * len(addrs)):int(0.8 * len(addrs))]
test_addrs = addrs[int(0.8 * len(addrs)):]
test_labels = label_to_index[int(0.8 * len(label_to_index)):]

. Я использую код в этой ссылке для построения набора данных tf.data:https://www.tensorflow.org/tutorials/load_data/images

...