Как использовать категориальные переменные (дискретные переменные) в многопеременных моделях линейной регрессии.Как мы знаем, модели линейной регрессии основаны на непрерывных данных.Дискретные переменные (например, 0 и 1) эффективно работают в таких моделях, потому что имеют значения шага (да, нет, я не знаю).Очевидно, что легко поместить одну категориальную переменную в многопараметрическую линейную модель, но если у меня есть большинство, то такие дискретные переменные являются проблемой.
Это пример из реального опыта.Я разрабатывал модель для прогноза спроса на сеть хлебобулочных магазинов.У владельца возникла проблема: сколько припасов нужно отправить в магазины для второй смены.Для клиентов, которые возвращались с работы домой.
Я нашел 7 значительных переменных: первая переменная: 1. обычный день, 2. выходные 3. день перед праздником, вторая переменная: 1. плохая погода 2. хорошая погодаДА-НЕТ В-третьих: температура (продолжает данные) В-четвертых: какой день недели (с 1 по 7)
Пятое: проблемы со связью в поездах ДА-НЕТ (для магазинов рядом с железнодорожными станциями)
Владелец должензнать, сколько (в количестве) нужно отправить продукты для удовлетворения спроса.Таким образом, логистическая регрессия исключена.У меня была идея преобразовать дискретные данные в непрерывные, используя любые статистические инструменты.Но то же самое я достигаю внутри модели линейной регрессии.Я понятия не имею, как решить эту проблему.