конвертировать целочисленные столбцы в категориальные в фрейме данных pyspark - PullRequest
0 голосов
/ 15 января 2020

Я пытаюсь преобразовать некоторые столбцы из целочисленных в категориальные в pyspark dataframe.

Мой dataframe:

  id       color
  dgf      2
  tyg      0
  tup      1

Столбец 'color' сохраняется как целое число, потому что он был закодирован , Мне нужно преобразовать его в категориальный, чтобы я мог запускать модели машинного обучения для данных.

Я пробовал следующие посты, но они не работают. Они создают несколько новых векторов в кадре данных, но мне просто нужно сделать тип данных столбца «color» категоричным.

Как я могу объявить столбец как категориальный элемент в DataFrame для использования в мл

Преобразовать все номинальные переменные в категориальные переменные в pyspark

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...