Я пытаюсь преобразовать некоторые столбцы из целочисленных в категориальные в pyspark dataframe.
Мой dataframe:
id color dgf 2 tyg 0 tup 1
Столбец 'color' сохраняется как целое число, потому что он был закодирован , Мне нужно преобразовать его в категориальный, чтобы я мог запускать модели машинного обучения для данных.
Я пробовал следующие посты, но они не работают. Они создают несколько новых векторов в кадре данных, но мне просто нужно сделать тип данных столбца «color» категоричным.
Как я могу объявить столбец как категориальный элемент в DataFrame для использования в мл
Преобразовать все номинальные переменные в категориальные переменные в pyspark