У меня есть проект, который предназначен для прогнозирования количества людей в моем местном спортзале с учетом даты и погоды.
Вот мое ядро Kaggle
У меня есть дванаборы данных, пассажиры в данный час и погода в данный час.Мой процесс состоит в том, что я объединяю эти два набора данных и использую Occupants в качестве цели.Тем не менее, когда я реализую алгоритм регрессии, я могу достичь только прогноза на уровне 57%.
Мне бы очень хотелось получить совет о том, как изменить свое решение для достижения лучших прогнозов?
Спасибо.