Панды - get_dummies со значением из другого столбца - PullRequest
0 голосов
/ 21 марта 2019

У меня есть датафрейм, как показано ниже.Столбец Mfr Number является категориальным типом данных.Я бы хотел предварительно сформировать get_dummies или одну горячую кодировку, но вместо того, чтобы заполнять новый столбец 1, если он из этой строки, я хочу, чтобы он заполнил значение из столбца quantity.Все остальные новые «манекены» должны остаться в этом ряду.Возможно ли это?

    Datetime            Mfr Number                quantity
0   2016-03-15 07:02:00 MWS0460MB                 1
1   2016-03-15 07:03:00 TM-120-6X                 3
2   2016-03-15 08:33:00 40.50699.0095             5
3   2016-03-15 08:42:00 40.50699.0100             1
4   2016-03-15 08:46:00 CXS-04T098-00-0703R-1025  10

Ответы [ 3 ]

3 голосов
/ 21 марта 2019

Сделайте это в два этапа:

dummies = pd.get_dummies(df['Mfr Number'])
dummies.values[dummies != 0] = df['Quantity']
1 голос
/ 21 марта 2019

Проверьте с str.get_dummies и mul

df.Number.str.get_dummies().mul(df.quantity,0)
   40.50699.0095  40.50699.0100    ...      MWS0460MB  TM-120-6X
0              0              0    ...              1          0
1              0              0    ...              0          3
2              5              0    ...              0          0
3              0              1    ...              0          0
4              0              0    ...              0          0
[5 rows x 5 columns]
0 голосов
/ 05 мая 2019
df = pd.get_dummies(df, columns = ['Mfr Number'])
for col in df.columns[2:]:
    df[col] = df[col]*df['quantity']
...