При использовании стандартного FastForestRegressor, подобного следующему:
pipeline.Add(new FastForestRegressor());
Мой ожидаемый результат - это скорее «среднее», чем «это должно быть» предсказание.
Следующее изображение содержит временные интервалы (ЧЧ: мм: сс) с числом:
Чем больше число, тем больше вероятность, что мой прогноз должен дать мне этот часиз числа.Теперь жирным шрифтом внизу вы можете увидеть прогнозы, которые действительно являются своего рода средним значением для всех заданных значений.он предсказывает время, которое даже не имеет записи.Что я ожидаю:
- Столбец 1: 9:00:00 имеет 140 значений, поэтому он должен возвращать прогноз, близкий к этому
- Столбец 2: 14:00:00 имеет 152 значениядругие 2 ниже также высоки, поэтому что-то в этом диапазоне между 14: 00: 00-16: 00: 00.
Я пытался настроить параметры FastForestRegressor, но это некажется, что-то вообще что-то меняет.
Мои данные хранятся как:
time,day
480,1
480,1
.. и т. д.
Теперь для верхнего левого в изображении (8: 00: 00 110), 110 строк значений (480,1) хранятся в файле.Может быть, я должен сделать дополнительный столбец с суммой?
Мне кажется, что мне нужно отрегулировать какую-то группировку или сглаживание, поэтому для этого требуется максимально возможный кандидат, а не среднее значение, но я не могу его найти.