Вы можете следовать советам из других ответов для отношения разделения набора данных.Однако размер пакета не имеет абсолютно ничего отношения к тому, как вы разбили свои наборы данных.
Размер пакета определяет, сколько примеров обучения обрабатывается параллельно для обучения / вывода.Размер партии во время обучения может влиять на то, насколько быстро и насколько хорошо ваши тренировки сходятся.Вы можете найти обсуждение этого эффекта здесь .Таким образом, для train_batch_size
стоит выбрать размер пакета, который не является ни слишком маленьким, ни слишком большим (как обсуждалось в ранее связанном обсуждении).В некоторых приложениях использование наибольших возможных тренировочных партий может оказаться желательным, но в целом вы выбираете его с помощью экспериментов и проверки.
Однако для validation_batch_size
и test_batch_size
следует выбирать наибольшую партию.размер, который ваше оборудование может обрабатывать без исчерпания памяти и сбоев.Обнаружение этого обычно является простым методом проб и ошибок.Чем больше размер вашего пакета во время вывода, тем быстрее он будет выполняться, поскольку параллельно можно обрабатывать больше входных данных.
РЕДАКТИРОВАТЬ: вот дополнительная полезная ссылка (стр. 276) дляучебный компромисс между размером книги Гудфеллоу и др.