Какая модель должна использоваться для предсказания (событие в%, время). Распределение не является линейным - PullRequest
0 голосов
/ 27 октября 2019

У меня есть некоторые измерения для заполнения парковки на целый день. Это означает, что ночью парковка полностью занята. Около полудня занятость не высока.

Если я проиллюстрирую это на диаграмме X, Y, то это будет выглядеть как парабола (-x ^ 2) Ось X - это время с полуночи до 23:59. Ось Y Свободные парковочные места в%

Какая модель будет более подходящей для прогнозирования? линейная регрессия? скорее это должна быть не линейная регрессия, верно? или мне взять другую модель?

1 Ответ

1 голос
/ 27 октября 2019

Кажется, что есть отдельные группы данных, здесь грубо нарисованные от руки. Две ранние утренние группы, две вечерние группы и одна группа в середине дня. Мое предложение состоит в том, чтобы разбить данные на разные модели в зависимости от времени суток: одну для ранних часов, одну для середины дня и одну для вечерних часов. Если у вас есть какой-либо способ отличить две утренние и две вечерние группы, моделирование будет значительно улучшено - например, это могут быть люди, которые платят ежедневно, а не ежемесячно.

enter image description here

...