Я работаю над проблемой регрессии.У меня есть категориальный столбец, который имеет 24 категориальных значения. Горячее кодирование показывает слишком много фиктивных переменных.Есть ли способ избежать множественной фиктивной переменной ловушки.Пожалуйста, помогите мне вот мой образец категориального столбца
После кодирования метки
Спасибо
Вы можете использовать это:
df['column'] = df['column'].astype('category').cat.codes
Пример:
df = pd.DataFrame(['a','b','c','d','a','c','a','d'], columns=['column'])
Выход:
column 0 0 1 1 2 2 3 3 4 0 5 2 6 0 7 3