Насколько важна разница потерь между данными обучения и валидации в начале обучения нейронной сети? - PullRequest
0 голосов
/ 29 февраля 2020

Короткий вопрос: Является ли разница между валидацией и потерей обучения в начале обучения (в первые эпохи) хорошим показателем количества данных, которые следует использовать? Например, будет ли хорошим способом увеличить объем данных, пока разница в начале не станет настолько малой, насколько это возможно? Это сэкономило бы мне время и вычисления.

backround: Я работаю над нейронной сетью, которая очень быстро перезаряжается. Лучший результат после применения множества различных методов, таких как отсев, нормализация пакетов, снижение скорости обучения, уменьшение размера пакета, увеличение разнообразия данных, сокращение слоев, увеличение размеров фильтра ... все еще очень плохой. В то время как потери на тренировку уменьшаются очень хорошо, потери на валидацию слишком рано (я имею в виду, что слишком рано, желаемая потеря не достигается, она должна быть во много раз меньше). Поскольку тренировка с моим набором данных ~ 200 выборок заняла 24 часа в течение 50 эпох, Я надеялся найти способ борьбы с переобучением всеми методами, описанными выше, прежде чем увеличивать объем данных. Потому что ничего не помогло, я нахожусь в точке увеличения объема данных. Я думаю о том, сколько данных может быть достаточно для моей сети, чтобы устранить перегрузки. Я знаю, что на это нелегко ответить, потому что это зависит от сложности данных и задачи, которую я пытаюсь решить .. поэтому я пытаюсь обобщить свой вопрос следующим образом:

1 Ответ

1 голос
/ 01 марта 2020

Краткий ответ на короткий вопрос : Нет

Объяснение : Существует корреляция между (train_loss - val_loss) и количеством данных, которые вам нужны для обучения вашего модель, но есть множество других факторов, которые могут быть источником большого (train_loss - val_loss). Например, ваша сетевая архитектура слишком мала, и поэтому ваша модель быстро подходит. Или ваш набор проверки не отражает данные обучения. Или ваша скорость обучения слишком велика. Или ...

Итак, моя рекомендация: сформулируйте вашу проблему в другом SO-вопросе и спросите: "Что я могу делать не так?"

...