Целевое кодирование отображает категориальную переменную на среднее значение целевой переменной.Поскольку он использует цель, необходимо предпринять шаги, чтобы избежать переобучения (обычно это делается сглаживанием).
Двоичное кодирование преобразует каждое целое число в двоичные цифры, причем каждая двоичная цифра имеет один столбец.По сути, это форма хэширования функций.
Оба помогают снизить количество категориальных переменных, что помогает повысить производительность некоторых моделей, особенно в случае моделей на основе дерева.