У меня есть набор данных, как показано ниже:
Описание данных :
Источник-Dest : названия магазинов. Всего ~ 1000 комбинаций
Дата : ежедневные данные, каждая комбинация источник-назначение имеет данные за 22 месяца
Кол-во на складе, Заказ на продажу: Малочисловые столбцы, которые влияют на целевую переменную - количество отправлений
количество отправлений : целевая переменная, которая должна быть спрогнозирована на 14 дней вперед - с 1 сентября по 14 сентября (вданный пример)
Я пробовал:
- традиционные методы ML, такие как RF и XGBoost, после преобразования столбца даты в функции даты, такие как год, месяц, неделягод, неделя месяца, флаг выходного дня и т. д.
- временной ряд - ARIMA и Prophet (пакет FB). Но они не масштабируемы. Итак, для 1000 комбинаций Source-Dest я должен использовать 1000 различных моделей, что невозможно в бизнес-сценарии
Я читал о LSTM с различными числовыми переменными x, чтобы предсказать y ( Ссылка ). Но мои данные содержат числовые переменные x (например, Qty) вместе с категориальными переменными x (например, ~ 1000 комбинаций магазинов). Как мне поступить с этим? Как мне подготовить набор данных для этого? Я слышал о сетях кодера-декодера , но не уверен, как реализовать этот тип данных.