Кривая потери валидации плоская, а кривая потери тренировки выше кривой ошибки валидации - PullRequest
0 голосов
/ 13 июля 2020

Я создаю модель LSTM для прогнозирования сенарио. В моем наборе данных около 248000 фрагментов данных, и я использую 24000 (около 10%) в качестве набора для проверки, другие - набор для обучения. Моя кривая обучения модели выглядит следующим образом: кривая обучения

Ошибка проверки всегда равна 0,00002 с нуля, а ошибка обучения уменьшилась до 0,013533 в эпоху 20.

I ' мы внимательно прочитали это: https://machinelearningmastery.com/learning-curves-for-diagnosing-machine-learning-model-performance/

Является ли мой набор проверки нерепрезентативным? Можно ли использовать более крупный набор для проверки?

1 Ответ

0 голосов
/ 15 июля 2020

Может случиться так, что, во-первых, ваша основная концепция очень проста, что приводит к очень низкой ошибке проверки на раннем этапе. Во-вторых, ваше увеличение данных затрудняет обучение, что приводит к более высокой ошибке обучения.

Тем не менее, я бы все же провел пару экспериментов в вашем случае. Во-первых: разделите данные на 10/90 вместо 90/10 и посмотрите, как тогда изменится ваша ошибка проверки - надеюсь, вы увидите какую-то кривую между (теперь более короткими и более сложными) эпохами. Во-вторых, я бы запустил валидацию перед обучением (или после эпохи 1 партии), чтобы получить случайный результат.

...