Что такое TargetEncoder и BinaryEncoder в sklearn category_encoders? - PullRequest
0 голосов
/ 28 марта 2019

Я искал способ векторизовать категориальные переменные, а затем я наткнулся на category_encoders.Он поддерживает несколько способов категоризации.

Я пробовал TargetEncoder и BinaryEncoder, но документы не объясняют много о его работе?

Я действительно ценю, если кто-нибудь может объяснить, как целевой кодировщик и двоичный кодРабота кодировщика и чем они отличаются от одной горячей кодировки?

1 Ответ

1 голос
/ 22 апреля 2019

Целевое кодирование отображает категориальную переменную на среднее значение целевой переменной.Поскольку он использует цель, необходимо предпринять шаги, чтобы избежать переобучения (обычно это делается сглаживанием).

Двоичное кодирование преобразует каждое целое число в двоичные цифры, причем каждая двоичная цифра имеет один столбец.По сути, это форма хэширования функций.

Оба помогают снизить количество категориальных переменных, что помогает повысить производительность некоторых моделей, особенно в случае моделей на основе дерева.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...