Я вхожу в Deeplearning4j и нахожусь на этапе, когда мне нужно усовершенствовать свое обучение LSTM, но я столкнулся с мятежными блокаторами.
До сих пор я основывал свою работу на различных примерах прогнозирования временных рядов вDeeplearning4j.Я могу обучить LSTM с использованием DataSet и с некоторой степенью точности предсказать будущие шаги, но не уверен, как убедиться, что мои конфигурации правильные, то есть, что я не переоцениваю свои данные.
Я использовал пользовательский интерфейс Deeplearing4j, чтобы помочь понять процесс обучения, но меня немного смущают некоторые показатели.Мне было интересно, если кто-нибудь мог бы уточнить, в чем разница между линиями Сводка и Оценка на диаграмме в левом верхнем углу страницы обзора?Я предоставил изображение этого ниже.Относятся ли они к ошибкам в обучении и валидации, которые идентифицируют перебор или недопоставку данных?
Если нет, то как лучше всего извлечь эту информацию и диагностировать любые проблемы с моим LSTM?Я видел использование класса Evaluation, но не уверен, что это уже сделано плагином пользовательского интерфейса?Кроме того, если требуется класс Evaluation, есть ли способ интегрировать его в плагин пользовательского интерфейса, чтобы его было легко отображать?
Я также использую DataSet вместо DataSetIterator, что может вызвать проблемы при использовании Evaluator.класс, поскольку я не вижу способа оценить сеть, используя простой набор данных.
Мой последний вопрос - немного больше, чем обычный тренинг по временным рядам.Я понимаю, что для достижения полезной оценки моей сети, используется разделение обучающих данных.Например, 70% используется для обучения и 30% для оценки.В случае данных временных рядов это может быть проблематичным?Если не все данные используются в процессе обучения, это может означать, что LSTM не изучает самые последние и актуальные тенденции, которые позволяют ему хорошо выполнять свою работу.Как это обычно решается при использовании Depplearing4j для прогнозирования временных рядов?
Любая помощь будет принята с благодарностью!