Как избежать ловушки фиктивной переменной для нескольких категорий в одном столбце - PullRequest
0 голосов
/ 25 сентября 2018

Я работаю над проблемой регрессии.У меня есть категориальный столбец, который имеет 24 категориальных значения. Горячее кодирование показывает слишком много фиктивных переменных.Есть ли способ избежать множественной фиктивной переменной ловушки.Пожалуйста, помогите мне вот мой образец категориального столбца enter image description here

После кодирования метки

enter image description here

Спасибо

1 Ответ

0 голосов
/ 25 сентября 2018

Вы можете использовать это:

df['column'] = df['column'].astype('category').cat.codes

Пример:

df = pd.DataFrame(['a','b','c','d','a','c','a','d'], columns=['column'])

Выход:

   column
0       0
1       1
2       2
3       3
4       0
5       2
6       0
7       3
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...