Как сделать прогноз для регрессионного анализа с несколькими целевыми переменными - PullRequest
0 голосов
/ 29 марта 2019

У меня есть набор данных проката велосипедов. В этом наборе данных нашей целевой переменной является Count, то есть общее количество прокатов велосипедов, которое является суммой двух переменных в нашем наборе данных, то есть переменной количества случайных пользователей и переменной количества зарегистрированных пользователей. Итак, мой вопрос: как мне выполнить моделирование на этом наборе данных? Пожалуйста, предложите сделать шаг, поскольку я думаю об исключении случайной и зарегистрированной пользовательской переменной и сохранении только переменной count в качестве нашей переменной tagert вместе с другими переменными предиктора

1 Ответ

0 голосов
/ 29 марта 2019

Вопрос довольно расплывчатый, но я попытаюсь ответить на него.

Я не слишком уверен, что именно вы хотите предсказать. Предполагая, что это количество велосипедов, которые будут сданы в аренду в будущем.

Если различие между casual и зарегистрирован важно и имеет важное значение для целей вашего проекта, то вам, вероятно, следует рассматривать их как отдельные функции, а не объединять их в одну .

Напротив, если различие не имеет значения, и вы заботитесь только о количестве велосипедов, то вы должны хорошо их объединить и использовать общую сумму.

Я думаю, вы должны попытаться понять, чего вы пытаетесь достичь, и на какие вопросы вы хотите ответить с помощью анализа.

...