Горячее кодирование для двоичной категориальной переменной - PullRequest
0 голосов
/ 27 февраля 2019

Я пытаюсь закодировать функцию пола, содержащую два значения: мужской и женский.Я создал две основные функции из основной функции, is_male и is_female, содержащие логические значения.Но, применяя модели, я понял, что они дополняют друг друга.Влияет ли это на производительность модели, поскольку они кажутся коррелированными?

1 Ответ

0 голосов
/ 13 июля 2019

Однократное кодирование (создание отдельных столбцов для каждого значения столбца) не должно использоваться с двоичными переменными (в вашем случае MALE-FEMALE).

Это вызывает DUMMY VARIABLE TRAP .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...