У меня есть набор данных, составленный за несколько месяцев (с 15 января по 17 сентября), в котором сообщается о финансовом положении клиента за каждый месяц. Моя задача состоит в том, чтобы предсказать совокупные продажи для каждого клиента на следующие 12 месяцев.
Мой набор данных выглядит следующим образом (это необработанные данные, для обучения я буду создавать объекты с задержкой)
Month CustomerID NetSales
JAN-15 A 10
JAN-15 B 10
JAN-15 C 10
FEB-15 A 10
FEB-15 B 10
FEB-15 C 10
...
Как я могу разделить в TRAIN / VAL / TEST его с постоянством во времени? Могу ли я сделать что-то подобное?
- TRAIN -> все клиенты / месяцы с 15 января по 16 марта (я беру каждый месяц хотя бы один раз, поэтому модель будетизучать сезонные модели
- VAL -> все клиенты / месяцы с 16 апреля по 16 июня
- TEST -> все клиенты /месяцев с 16 июля по 16 сентября (я останавливаюсь здесь, потому что мне нужно 12 месяцев для создания целевой переменной)
Является ли это последовательной стратегией разделения? В качестве альтернативы, что бы вы посоветовали?
Большое спасибо, Андреа