Как нормализовать список из более чем 25 миллионов записей, используя fit_transform от MinMaxScaler - PullRequest
0 голосов
/ 19 февраля 2020

У меня есть список из более чем 25 миллионов записей (1D Array). Я хочу нормализовать значения от 0 до 5.

Для этого я использую MinMaxScaler от scikit-learn. Эта штука отлично работает с записями до 20M, но с увеличением размера она занимает огромное время.

Любые предложения, как это сделать оптимизированным способом.

...