У меня есть кадр данных, который выглядит следующим образом:
A B C
34 x a
3 y b
23 y a
40 x b
По сути, столбцы B и C должны стать фиктивными переменными с заголовками B_x, B_y, C_a, C_b.Функция почти точно так же, как get_dummies () работает в пандах, с одним существенным отличием: мне нужно, чтобы значение было значением в столбце A для всех фиктивных переменных, созданных там, где значение было бы равно 1. Что-то вроде
A B_x B_y C_a C_b
34 34 0 34 0
3 0 3 0 3
23 0 23 23 0
40 40 0 0 40
Я работаю с довольно большими данными с большим количеством категорий.
Я пытался использовать get_dummies () для набора данных, а затем df.mask, чтобы изменить все 1 на df.A, однако это ужасно медленно (около 10 минут).