Я использую Пророк , чтобы предсказать продажу билетов на живые мероприятия (концерты).До сих пор я работал только с одним событием.Чтобы улучшить прогнозы, я хочу объединить данные нескольких концертов, которые имеют отношение к тому, для которого я планирую прогнозировать.
Теперь задача состоит в том, чтобы у каждого события был свой максимум.вместимость.Следовательно, продажа 10000000 для total_gross за event_id 1 так же хороша, как продажа 5000000 за event_id 2 (в этом случае оба будут проданы).Некоторые примеры данных:
id created total_gross event_id max_capacity
1 2019-03-01 10:57:32.381378+00 18760 1 10000000
2 2019-03-01 10:58:30.93307+00 9380 1 10000000
3 2019-03-01 10:58:45.425421+00 7380 1 10000000
4 2019-03-01 10:59:11.588687+00 14760 1 10000000
5 2018-03-01 11:14:15.630797+00 7380 2 5000000
6 2018-03-01 11:14:25.308153+00 36900 2 5000000
7 2018-03-01 11:14:34.781773+00 7380 2 5000000
На моем чертеже здесь вы можете видеть масштабирование сверху до и красным цветом снизу после масштабирования.Теперь мне интересно, как правильно «преобразовать» мои данные.MinMaxScaler
правильный инструмент?И я бы просто передал эти массивы ему, как здесь?
np.array([[ total_gross, max_capacity_event_1],
[ total_gross2, max_capacity_event_1],
[ total_gross, max_capacity_event_2],
[...]])