Я пытаюсь преобразовать категориальные данные в числовые, используя get_dummies()
, но размер данных увеличивается с 1 X 1
до 1 X 22
, поскольку существует 22 различных категориальных переменных.
Я использовал get_dummies()
изpandas.
Код:
data['program_id'].unique()
cols_to_transform = data['program_id'].loc[:]
df_with_dummies = pd.get_dummies( data=cols_to_transform )
Как преобразовать категориальные данные моего столбца в числовые без увеличения размера данных.
Снимок экрана: