У меня плотный кадр данных панд.Я хотел бы получить из него разреженный фрейм данных, где каждое значение исходного фрейма данных было бы столбцом 1 в результирующем фрейме разреженных данных.
Пример:
Оригинал df:
a b
0 5 3
1 2 6
Разреженный df:
(0,3): 1
(0,5): 1
(1,2): 1
(1,6): 1
Мне все равно, если в случае столкновения это 1 или число столкновений
Я передам этот dfsklearn.linear_model.LogisticRegression fit function (я не уверен, какой тип разреженной матрицы будет принят здесь)
Какой будет подходящий подход?
Я могу создать его вручную (перебираястрока), но датафрейм довольно большой, поэтому я пытаюсь найти эффективный способ сделать это.
Спасибо