Панды получают пустышки () для числовых категориальных данных - PullRequest
0 голосов
/ 07 февраля 2019

У меня есть 2 столбца:

  • Пол (с категориальными значениями типа string как «мужской» и «женский»)
  • Класс (с категориальными значениями типа integer как 110)

Когда я выполняю pd.get_dummies() в вышеупомянутых 2 столбцах, только «Пол» кодируется в 2 столбца.Но 'Class' не конвертируется функцией get_dummies.

Я хочу, чтобы 'Class' также конвертировался в 10 фиктивных столбцов, аналогично One Hot Encoding.

Это ожидаемое поведение?Есть ли обходной путь?

1 Ответ

0 голосов
/ 07 февраля 2019

Вы можете преобразовать значения в строки:

df1 = pd.get_dummies(df.astype(str))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...