После OHE мои данные выглядят так:
client|feat1|feat2
1| 1| 0
3| 0| 1
5| 1| 0
Я хочу добавить эту информацию о клиенте / функциях в мой sparse df
. Я не могу просто вызвать разреженный конструктор, поскольку индексы (идентификаторы клиентов) имеют значение. Конструктор вернет разреженную матрицу 3x3, тогда как на самом деле у меня по крайней мере 6 строк (максимальное значение id в этом игрушечном примере равно 5) в моем sparse df
. Я знаю, как создавать и добавлять функции одну за другой, т.е. каждый раз создавать разреженную матрицу размера ( количество клиентов в sparse df
x 1 ) для каждой функции и складывать эту информацию в sparse df
.
Итак, мой вопрос:
Существует ли какой-либо эффективный способ использовать (добавить к sparse df
) всю информацию о OHE сразу о некоторых клиентах в отношении идентификатора клиента?