Глубокое обучение: причины, по которым важно перемешивать данные перед разделением на обучение / валидность / тест - PullRequest
0 голосов
/ 26 мая 2020

Я строю LSTM без сохранения состояния с определенным временным окном, чтобы предсказать график цен временного ряда. Поскольку у него нет состояния, нет необходимости в том, чтобы время windows оставалось упорядоченным для обучения, но его можно перетасовать (пока само временное окно не нарушено).

До сих пор я никогда раньше не перетасовывал разделение, которое я принял также, чтобы протестировать обучение с отслеживанием состояния. Однако теперь, когда я использую только без отслеживания состояния, есть ли причина не перемешивать перед разделением?

каковы фактические преимущества перетасовки в первую очередь? иметь большой набор данных, где первые 90% данных предназначены для обучения, следующие 5% - для проверки, а самые последние 5% данных - для тестирования. Я также использую байесовскую оптимизацию, чтобы найти лучшие гиперпараметры с моделью keras.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...