Разнообразие набора данных гораздо важнее, чем количество выборок, которые вы подаете в сеть.
Вы должны настроить свой набор данных так, чтобы он включал и усиливал данные, которые вы хотите изучать в сети.
После того, как вы создали этот пользовательский набор данных, вы должны начать играть с количеством сэмплов, поскольку оно полностью зависит от вашей проблемы.
Например: если вы строите нейронную сеть для обнаружения пиков определенного сигнала, было бы совершенно бесполезно тренировать вашу сеть с миллионом выборок сигналов, которые не имеют пиков. В этом заключается важность настройки набора учебных данных независимо от того, сколько у вас образцов.