Увеличивающиеся эпохи против растущих тренировочных данных - PullRequest
0 голосов
/ 27 сентября 2019

Для анализа изображений:

Лучше ли увеличить периоды, скажем, с 2 до 4 для 40000 изображений.Это занимает вдвое больше времени.

ИЛИ

Лучше ли увеличить размер тренировочных данных, с 40000 до 80000, но только с 2 эпохами.Это также займет вдвое больше времени.

Поскольку увеличение количества эпох и данных обучения займет много времени, я могу сделать только одну.

Каким должен быть выбор?

Спасибо.

1 Ответ

0 голосов
/ 27 сентября 2019

Не обращайте внимания (плохие / сбивающие с толку образцы, ...), всегда предпочтительнее увеличивать объем данных.Причиной этого является обобщение: вы можете показать одно и то же изображение в сеть N раз или N разных изображений.В первом случае он будет соответствовать учебному набору данных и не сможет обобщать новые изображения.

Это также причина, по которой существуют методы дополнения данных: если у вас нет «новых» данных для обученияВы можете попытаться сгенерировать «новые» образцы, применяя преобразования к тем, которые у вас есть.

Конечно, больше данных означает большие наборы данных для сбора, очистки, аннотирования, хранения, распространения, что в конечном итоге накладывает ограничение наразмер реальных наборов данных.Но если в вашем случае у вас есть доступные данные для обучения, используйте их.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...