Я построил модель с числовыми значениями c и факторными переменными для прогнозирования продаж на основе рекламы с еженедельными данными с 2017 по 2019 год, и я пытаюсь запустить код, который будет прогнозировать ежемесячные продажи на 2020 год для каждой комбинации переменных.
Для этого мне нужно ввести правильные фактор-переменные, и мне было интересно, как лучше всего это сделать go, вот как выглядит моя регрессия:
regads2 = lm(dolsales~flavour+brand+packaging+month+organization+manufacturer+region+displaydummie+addummie+maddummie+laddummie+discount5to10+discount10to15
+discount15to20+discount20to25+discount25to30+discount30to35+discount35to40+discount40to45+discount45to50+
discount50to55+discount55to60+discount60to65+discount65to70+discount70to75, na.action = na.exclude,data = df)
Каждая из переменных факторов имеет много уровней (от 5 до 30), в то время как переменные «скидки» являются фиктивными. Я пытался написать al oop, который генерировал бы данные, основанные на уровнях переменных, и сохранял их, но я не смог полностью туда добраться, и я немного застрял. Вот что я написал до сих пор (это работает для одной переменной, но не для многих)
input <- matrix(ncol= 1, nrow = nlevels(region))
for(i in c(0:nlevels(region))) {
working[i,] <- levels(region)[i]
}
input
Я думаю, что есть более простой способ go об этом.
Спасибо так много, я застрял на этом целую неделю.