Я работаю с данными временных рядов продаж, где у меня есть 5 продуктов A, B, C, D, E, а общий доход представляет собой сумму доходов всех 5 продуктов. Моя цель
1) предсказать, каким будет мой общий доход в следующем месяце
2) Разбивка общей выручки по продуктам (сколько выручки от каждого товара).
В первой части я использовал модель ARIMA для прогнозирования общего дохода в следующем месяце, и она работает с достаточно хорошей точностью. Например, я могу предсказать, что в августе 2019 года общий доход составит $ 150 тыс.
Что касается второй части, я не знаю, как мне это понять. Например, при разбивке 150 тыс. Долл. США продукт А: 20 тыс. Долл. США, продукт Б: 25 тыс. Долл. США, продукт С: 50 тыс. Долл. США, продукт D: 15 тыс. Долл. США, продукт Е: 40 тыс. Долл. США. Если бы не одно значение, то диапазон с определенной достоверностью тоже подойдет.
Несколько подходов, которые я рассмотрел:
i) Модель временного ряда построения для каждого продукта (не работает из-за недостатка данных для отдельного продукта)
ii) Я думаю, что эта проблема обратна наивному байесовскому, определите, какая особенность является наиболее вероятной причиной для данной переменной ответа?
Чтобы понять проблему, рассмотрим следующую таблицу (с фиктивными значениями), где Total - это переменная ответа, и я могу предсказать ее с хорошей точностью. Я хочу разбить продукт по последнему ряду.
Month A B C D E Total
18-Jan 546 174 46 284 58 1108
18-Feb 83 257 137 121 425 1023
18-Mar 122 378 505 468 228 1701
18-Apr 454 356 427 424 523 2184
18-May 304 501 318 68 411 1602
18-Jun 530 150 579 100 298 1657
18-Jul 67 408 219 217 59 970
18-Aug 347 166 174 327 129 1143
18-Sep 241 539 285 513 566 2144
18-Oct 385 17 487 354 409 1652
18-Nov 333 358 304 125 292 1412
18-Dec 449 278 595 154 451 1927
19-Jan 228 260 175 55 414 1132
19-Feb 10 202 82 511 299 1104
19-Mar 423 328 278 509 230 1768
19-Apr 15 63 581 85 440 1184
19-May 438 230 467 92 409 1636
19-Jun ? ? ? ? ? 1372
Есть предложения?