В книге Hands-On ML с Scikit-Learn, Tensorflow и Keras автор объясняет, как использовать API данных для эффективного управления, преобразования и передачи данных в модель, он пишет следующую функцию:
def csv_reader(filepaths, batch_size=32):
dataset = tf.data.Dataset.list_files(filepaths)
dataset = dataset.interleave(lambda filepath:
tf.data.TextLineDataset(filepath).skip(1), cycle_length=5)
dataset = dataset.shuffle(10000).repeat(1)
return dataset.batch(batch_size).prefetch(1)
Тогда: train_set = csv_reader_dataset(train_filepaths)
и: model.fit(train_set, epochs=10)
Чего я не понимаю, так это той части, где он создает фактический train_set из функции, не так ли он только одна партия данных? Он говорит, что мы создаем тренировочный набор один раз, и нам не нужно его повторять, потому что об этом позаботится Керас, но я не понимаю, как это сделать.