Эффективное преобразование ОХЭ в разреженный - PullRequest
0 голосов
/ 04 марта 2020

После OHE мои данные выглядят так:

client|feat1|feat2
     1|    1|    0
     3|    0|    1
     5|    1|    0

Я хочу добавить эту информацию о клиенте / функциях в мой sparse df. Я не могу просто вызвать разреженный конструктор, поскольку индексы (идентификаторы клиентов) имеют значение. Конструктор вернет разреженную матрицу 3x3, тогда как на самом деле у меня по крайней мере 6 строк (максимальное значение id в этом игрушечном примере равно 5) в моем sparse df. Я знаю, как создавать и добавлять функции одну за другой, т.е. каждый раз создавать разреженную матрицу размера ( количество клиентов в sparse df x 1 ) для каждой функции и складывать эту информацию в sparse df.

Итак, мой вопрос:

Существует ли какой-либо эффективный способ использовать (добавить к sparse df) всю информацию о OHE сразу о некоторых клиентах в отношении идентификатора клиента?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...