Не обращайте внимания (плохие / сбивающие с толку образцы, ...), всегда предпочтительнее увеличивать объем данных.Причиной этого является обобщение: вы можете показать одно и то же изображение в сеть N раз или N разных изображений.В первом случае он будет соответствовать учебному набору данных и не сможет обобщать новые изображения.
Это также причина, по которой существуют методы дополнения данных: если у вас нет «новых» данных для обученияВы можете попытаться сгенерировать «новые» образцы, применяя преобразования к тем, которые у вас есть.
Конечно, больше данных означает большие наборы данных для сбора, очистки, аннотирования, хранения, распространения, что в конечном итоге накладывает ограничение наразмер реальных наборов данных.Но если в вашем случае у вас есть доступные данные для обучения, используйте их.