Question

Я создаю модель LSTM для прогнозирования сенарио. В моем наборе данных около 248000 фрагментов данных, и я использую 24000 (около 10%) в качестве набора для проверки, другие - набор для обучения. Моя кривая обучения модели выглядит следующим образом: кривая обучения

Ошибка проверки всегда равна 0,00002 с нуля, а ошибка обучения уменьшилась до 0,013533 в эпоху 20.

I ' мы внимательно прочитали это: https://machinelearningmastery.com/learning-curves-for-diagnosing-machine-learning-model-performance/

Является ли мой набор проверки нерепрезентативным? Можно ли использовать более крупный набор для проверки?

y.selivonchyk · Answer 1 · 15 июля 2020

Может случиться так, что, во-первых, ваша основная концепция очень проста, что приводит к очень низкой ошибке проверки на раннем этапе. Во-вторых, ваше увеличение данных затрудняет обучение, что приводит к более высокой ошибке обучения.

Тем не менее, я бы все же провел пару экспериментов в вашем случае. Во-первых: разделите данные на 10/90 вместо 90/10 и посмотрите, как тогда изменится ваша ошибка проверки - надеюсь, вы увидите какую-то кривую между (теперь более короткими и более сложными) эпохами. Во-вторых, я бы запустил валидацию перед обучением (или после эпохи 1 партии), чтобы получить случайный результат.

Кривая потери валидации плоская, а кривая потери тренировки выше кривой ошибки валидации

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Кривая потери валидации плоская, а кривая потери тренировки выше кривой ошибки валидации

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы