Требуется помощь в разрешении или любых идеях для прогноза машинного обучения, состоящего из прогноза громкости вызова с интервалом в 30 минут и одновременного события.
Мы начали эту проблему с временного рядаизначально, но с треском провалился, так как временные ряды (ARIMAX, Prophet) не будут работать с тяжелыми событиями, управляемыми сценариями.
Позже, в конечном итоге, использовался регрессор Random леса, который дает лучшие результаты, чем KNN или полиномиальная регрессия.
Подробное обобщение приведено ниже:
Бизнес-проблема:
Прогноз громкости звонка с интервалом в 30 минут, громкость звонка зависит от тренда и зависит от события (весовой коэффициент 50-50 для обоих видовданных), данные предоставлены только за 4 месяца.
У нас много спортивных мероприятий, и они транслируются одновременно, например: с 22:00 до 22:30, будет 2 основныхсобытия и 14 второстепенных событий, передаваемых одновременно.
Нет данных о том, какое событие приводит к увеличению объема вызовов. Из интервала 30 интервалов или любых полезных показателей.
Предоставленные данные:
Дата, Интервалы, Событие, Event_Game, Время начала, Время окончания, Описание.
Добыча данных работала над:
Итак, с 4 месяцами знаний о различных событиях и их вызовах. Мы извлекли.
Время воспроизведения: Время начала-Время окончания,
Финалы: [Лига, Четвертьфиналы, Полуфиналы, Финалы] (Из описания)
Праздники: отмеченные праздники для соответствующего региона
Tournament_Importance: (из описания) (ранжируется в каждом турнире от 1 до 5, 1 - наименьшее, а 5 - наивысшее, например: европейские отборочные матчи заняли 4 место, а Объединенная футбольная лига - 1)
Player / Team_importance: ранжируется от 1 до 8, 1 - наименьший, а 8 - наивысший, основанный рейтинг игроков / команд.
Отброшенные тренды дня недели и интервала, такие как среднее и медианное значение, среднее значение интервала и среднее значение.
Моделирование:
При подаче на модель с функциями, обеспечивающими максимальную точность, мы получаем 75% точности при суммировании по дням и 40% и 30-минутный уровень интервала, который ищеточень плохой.
прогнозируемые результаты не зависят от конкретной игры. Например: NBA может генерировать 1800 вызовов в день, в другой день тот же NBA может генерировать только 900 вызовов во время своего плaytime интервалы.
На данный момент агрегированные результаты дня отображаются с точностью до 99% и иногда с точностью до 60% (ничего непоследовательного).
На уровне 30-минутного интервала из 48 интерваловмы можем получить точность 80% только за 40% - 50% времени.