Почему бы не применить один горячий кодировщик, зная, что при запуске файла нет ошибок? - PullRequest
0 голосов
/ 09 октября 2019

Я хочу применить одну горячую кодировку к одному столбцу, который называется «drive_wheels». Однако при работе не возникает ошибок и никаких изменений в наборе данных! Есть ли ошибка в коде?

import pandas as pd
import numpy as  np

df = pd.read_csv('onehotencoding.csv')

df.head()

obj_df = df.select_dtypes(include=['object']).copy()
obj_df.head()

pd.get_dummies(obj_df, columns=["drive_wheels"]).head()

1 Ответ

1 голос
/ 09 октября 2019

pd.get_dummies () не имеет переключателя inplace. Поэтому вам необходимо присоединить полученный DataFrame к вашему оригиналу:

dummies = pd.get_dummies(obj_df, columns=["drive_wheels"]).head()
combined = df.join(dummies)

Например:

df = pd.DataFrame(list('AABBABA'), columns=['cats'])
dummies = pd.get_dummies(df, columns=['cats'])
combined = df.join(dummies)
print(combined)

, что дает вам:

  cats  cats_A  cats_B
0    A       1       0
1    A       1       0
2    B       0       1
3    B       0       1
4    A       1       0
5    B       0       1
6    A       1       0
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...