потери при обучении и проверке
(1) Я использую те же шаги предварительной обработки для набора для обучения и проверки. (2) Передача того же набора данных, что и набор для обучения и проверки. (3) Наличие одинакового количества шагов на эпоху (шагов на эпоху = длина набора данных / пакетная длина) для потери обучения и проверки.
Потери на обучение снижаются, как и ожидалось, но потери при проверке (на том же уровне набор данных, используемый для обучения) сильно колеблется.
Мое намерение состоит в том, чтобы использовать удерживаемый набор данных для проверки, но я видел аналогичное поведение на удерживаемом наборе данных проверки. Итак, я подумал, что передам обучающий набор данных в качестве проверки (в целях тестирования) - все равно наблюдаю то же поведение.
Что может происходить?