Двоичное кодирование для нескольких столбцов - PullRequest
0 голосов
/ 01 сентября 2018

У меня есть таблица панд с кодировкой, подобной этой:

id var1 var2 var3
1   1    3    4
2   2    5
3   1    2 

An хотел бы преобразовать его в двоичный файл, как это

id x1 x2 x3 x4 x5
1  1  0  1  1  0
2  0  1  0  0  1
3  1  1  0  0  0

Эффективно отображая положение каждой переменной.

1 Ответ

0 голосов
/ 01 сентября 2018

Использование get_dummies

In [506]: (pd.get_dummies(df.filter(like='var').stack())
             .sum(level=0).rename(columns='x{:.0f}'.format))
Out[506]:
   x1  x2  x3  x4  x5
0   1   0   1   1   0
1   0   1   0   0   1
2   1   1   0   0   0
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...