Как прогнозировать с использованием линейной регрессии в R, исключая поведенческие значения, которые были вменены - PullRequest
0 голосов
/ 15 апреля 2019

Это будет лучше всего проиллюстрировано на простом примере, демонстрирующем принцип того, чего я пытаюсь достичь (хотя я знаю, что этот пример нереалистичен, а часть логики не полностью доказана).

В примере приведены исторические и прогнозируемые продажи мороженого.Исторические данные относятся к июню, а прогнозные данные - с июля по декабрь.Эти продажи основаны на R = доступный ресурс, сделано = произведено мороженое, rate1 = процент произведенного ресурса, куплено = куплено мороженое, rate2 = процент произведено куплено.

Модель выполняетлинейная регрессия на скорость1 к прогнозу скорость1 с июля по декабрь.Количество мороженого, сделанного в месяц = ​​R * rate1.Затем модель выполняет линейную регрессию для скорости 2 к прогнозу скорости 2 с июля по декабрь.Количество мороженого, купленного в месяц = ​​произведено * норма 2.

Мои данные:

Месяц = ​​январь: декабрь

R = 28, 30, 32, 34, 36, 38, 40, 42, 36, 35, 40, 42

Сделано = 24, 26, 28, 30, 32, 34, 36, 38, 34, 33, 35, 37

Rate1 = 86%, 87%, 88%, 88%, 89%, 89%, 90%, 90%, 94%, 94%, 88%, 88%

Куплено = 18,5, 20,3,22,1, 24,0, 25,9, 27,9, 29,9, 31,9, 28,9, 28,4, 30,5, 32,6

Rate2 = 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%

В сентябре и октябре у меня мало ресурсов (R), и я не смогу делать столько мороженого (или больше), сколько обычнобыло бы.То, как модель учитывает это, прекрасно.

Мои мороженые, хотя и очень вкусные, и клиенты все еще хотят покупать мороженое такого же уровня (хотя не все мороженое, поскольку они не хотятхвалить мое эго).Моя модель не учитывает такой поведенческий отклик у клиентов, как это прогнозируется по ставке2.С этим поведенческим откликом я бы ожидал (для грубого примера) 30 мороженых, купленных в сентябре и 29 в октябре.

Я хочу продолжить прогноз линейной регрессии скорости2, новключая поведенческое состояние, при котором, если количество мороженого, изготовленного в месяце х, меньше, чем количество мороженого, произведенного в лаге (х), то прогноз по купленному мороженому.Иначе, прогноз по ставке 2.

Я предполагаю, что мне нужно будет указать модели исключить поведенческие значения при прогнозировании после этого.Поведенческие значения для мороженого, купленного в сентябре и октябре, приведут к тому, что показатель rate2 приблизится к 100%;это повлияет на прогнозируемый курс2 на декабрь.Я не хочу этого, потому что мороженое должно начать расти снова в декабре.

Я не уверен, является ли это методологически обоснованным или есть более подходящий метод для использования здесь.Довольно простой со статистикой и новичком в R. Любой совет будет высоко ценится!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...