У меня есть данные о продажах, расходах на рекламу и ценах для 10 брендов той же отрасли за 2013-2018 годы.Я хочу разработать уравнение для прогнозирования продаж в 2019 году.
У меня есть следующие переменные (цена и расходы на рекламу по типу): журнал PricePerUnit, новости, наружная реклама, вещание, печать.
путаницаЯ не уверен, стоит ли запускать регрессию, используя только данные 2018 года с продажами 2018 года в качестве целевой переменной и добавлением дополнительной переменной, такой как Past_2Yeas_Sales (2016-17), к указанным выше переменным цены и затрат на рекламу (для ясности - см. Изображение данных).С этим типом данных у меня будет размер выборки всего 10, так как есть только 10 брендов.Я думаю, что это слишком мало для линейной регрессии, чтобы дать правильные результаты.
Второй вариант (который увеличит размер выборки). Я полагаю, что вместо того, чтобы иметь бренд в качестве наблюдения, я беру бренд + год в качестве наблюдения, который увеличит размер моей выборки до 60 - например, для бренда Аимеет 6 наблюдений, таких как A-2013, A-2014, A-2014 ..., A-2018, B имеет B-2013, B-2014..B-2018 и т. д. для 10 брендов (см. изображение для данных).
Является ли второй вариант допустимым способом запуска регрессии?Как правильно проводить регрессию в таких ситуациях небольшого размера выборки?