Как правило, глубокие нейронные сети обычно получают больше данных.
Если у вас есть хорошо описанная модель и правильно спроектированы входные данные, вы потеряете, если выберете меньшее подмножество своего набора данных.
Однако вы всегда можете оценить это с помощью метрик. Проверьте, как уменьшается ваша потеря при каждом размере выборки, начиная с 8000 пар.
При больших проблемах всегда следует помнить, что время вычислений обычно также велико.