Поезд / Вал / Испытание разделенного времени LSTM - PullRequest
0 голосов
/ 01 октября 2019

У меня есть набор данных, составленный за несколько месяцев (с 15 января по 17 сентября), в котором сообщается о финансовом положении клиента за каждый месяц. Моя задача состоит в том, чтобы предсказать совокупные продажи для каждого клиента на следующие 12 месяцев.

Мой набор данных выглядит следующим образом (это необработанные данные, для обучения я буду создавать объекты с задержкой)

Month   CustomerID NetSales
JAN-15     A          10
JAN-15     B          10
JAN-15     C          10
FEB-15     A          10
FEB-15     B          10
FEB-15     C          10
...

Как я могу разделить в TRAIN / VAL / TEST его с постоянством во времени? Могу ли я сделать что-то подобное?

  • TRAIN -> все клиенты / месяцы с 15 января по 16 марта (я беру каждый месяц хотя бы один раз, поэтому модель будетизучать сезонные модели
  • VAL -> все клиенты / месяцы с 16 апреля по 16 июня
  • TEST -> все клиенты /месяцев с 16 июля по 16 сентября (я останавливаюсь здесь, потому что мне нужно 12 месяцев для создания целевой переменной)

Является ли это последовательной стратегией разделения? В качестве альтернативы, что бы вы посоветовали?

Большое спасибо, Андреа

1 Ответ

0 голосов
/ 01 октября 2019

Это последовательная стратегия разделения?

Да, вы уважаете тот факт, что вы не используете данные для своего набора проверки, который находится перед данными обучения, то же самое для вашего набора испытаний. Вы предотвращаете утечку данных, это правильный способ сделать это.

В качестве альтернативы, что бы вы посоветовали?

Единственное, что вы можете изменить, эточасть вашего поезда, val, тестовый набор, но это вы можете попробовать. Поскольку это временные ряды, вы должны учитывать сезонные тренды, чтобы все они были отражены в ваших данных обучения.

...