Как One-Hot значение в одном столбце, где оно содержит несколько значений - PullRequest
0 голосов
/ 05 октября 2019

Как разделить значения на столбцы и установить 1 для записи, если она содержит значение

создание набора данных

   df = pd.DataFrame({
    "date": ['1-1-2019', '1-2-2019'],
    "data": ['abc,bcd','abc,efg,hij'],
    "Others" :['Other column info','Other column info']
})

Исходные данные

    date       data          Others
  1-1-2019     abc,bcd       Other column info
  1-2-2019     abc,efg,hij   Other column info

Ожидаемый результат

    date     abc   bcd  efg   hij   Others
   1-1-2019   1     1    0     0    Other column info
   1-2-2019   1     0    1     1    Other column info

1 Ответ

1 голос
/ 05 октября 2019

вы можете использовать функцию get_dummies методов str, как показано ниже

pd.concat([df, df.data.str.get_dummies(sep=",")], axis=1)
...