Sklearn: Является ли MinMaxScaler правильным инструментом? - PullRequest
0 голосов
/ 26 июня 2019

Я использую Пророк , чтобы предсказать продажу билетов на живые мероприятия (концерты).До сих пор я работал только с одним событием.Чтобы улучшить прогнозы, я хочу объединить данные нескольких концертов, которые имеют отношение к тому, для которого я планирую прогнозировать.

Теперь задача состоит в том, чтобы у каждого события был свой максимум.вместимость.Следовательно, продажа 10000000 для total_gross за event_id 1 так же хороша, как продажа 5000000 за event_id 2 (в этом случае оба будут проданы).Некоторые примеры данных:

id  created                         total_gross event_id    max_capacity
1   2019-03-01 10:57:32.381378+00   18760       1   10000000
2   2019-03-01 10:58:30.93307+00    9380        1   10000000
3   2019-03-01 10:58:45.425421+00   7380        1   10000000
4   2019-03-01 10:59:11.588687+00   14760       1   10000000
5   2018-03-01 11:14:15.630797+00   7380        2   5000000
6   2018-03-01 11:14:25.308153+00   36900       2   5000000
7   2018-03-01 11:14:34.781773+00   7380        2   5000000

На моем чертеже здесь вы можете видеть масштабирование сверху до и красным цветом снизу после масштабирования.Теперь мне интересно, как правильно «преобразовать» мои данные.MinMaxScaler правильный инструмент?И я бы просто передал эти массивы ему, как здесь?

np.array([[ total_gross, max_capacity_event_1],
         [ total_gross2,  max_capacity_event_1],
         [ total_gross, max_capacity_event_2],
         [...]])
...