Как повысить точность прогнозирования занятости? - PullRequest
0 голосов
/ 25 сентября 2019

У меня есть проект, который предназначен для прогнозирования количества людей в моем местном спортзале с учетом даты и погоды.

Вот мое ядро ​​Kaggle

У меня есть дванаборы данных, пассажиры в данный час и погода в данный час.Мой процесс состоит в том, что я объединяю эти два набора данных и использую Occupants в качестве цели.Тем не менее, когда я реализую алгоритм регрессии, я могу достичь только прогноза на уровне 57%.

Мне бы очень хотелось получить совет о том, как изменить свое решение для достижения лучших прогнозов?

Спасибо.

1 Ответ

0 голосов
/ 26 сентября 2019

Для повышения точности:

  • Выполнение дополнительных функций.
  • Вы можете преобразовать свою категориальную переменную в одно горячо закодированное значение.
  • Вы можете сделать однодополнительная функция с указанием утра, дня, вечера, ночи, используя часы из метки времени, а также вы можете добавить столбец «день недели / выходные».
  • Вы не сделали EDA много.Проверьте наличие выбросов и удалите их.
...