Используя приведенный ниже код, я хотел бы задать несколько вопросов о том, что именно происходит под ним.
dataset = tf.data.TFRecordDataset(filepath)
dataset = dataset.map(parse_function, num_parallel_calls=4)
dataset = dataset.repeat()
dataset = dataset.shuffle(1024)
dataset = dataset.batch(16)
iterator = dataset.make_one_shot_iterator()
1. dataset.map(parse_function, num_parallel_calls=4)
- Сколько записей мы загружаем здесь?Сколько поместится в памяти или какое-то фиксированное число?
2. dataset = dataset.repeat()
- Что именно мы повторим?В данный момент загружен фрагмент данных из пункта .1?Если это так, значит ли это, что мы больше не будем загружать другие?
3. Как именно работает перемешивание?
4.Можно ли использовать повторение, перемешивание и пакет перед отображением и обработкойпути к файлам вместо одних файлов?