Как преобразовать категориальную переменную в числовую в пандах без увеличения размера данных? - PullRequest
0 голосов
/ 07 июня 2018

Я пытаюсь преобразовать категориальные данные в числовые, используя get_dummies(), но размер данных увеличивается с 1 X 1 до 1 X 22, поскольку существует 22 различных категориальных переменных.

Я использовал get_dummies() изpandas.

Код:

data['program_id'].unique()

cols_to_transform = data['program_id'].loc[:]

df_with_dummies = pd.get_dummies( data=cols_to_transform )

Как преобразовать категориальные данные моего столбца в числовые без увеличения размера данных.

Снимок экрана: enter image description here

1 Ответ

0 голосов
/ 07 июня 2018

Вы можете использовать factorize

df['columns']=pd.factorize(df['columns'])[0]#df.columns.astype('category').cat.codes

или LabelEncoder из sklearn

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...