Зачем нужно преобразовывать целочисленное кодирование в двоичное кодирование? - PullRequest
0 голосов
/ 07 сентября 2018

Зачем нужно преобразовывать целочисленное кодирование в двоичное кодирование? Я проверил разные сайты, учебники, но не смог понять, что именно он делает и для чего он нужен. У нас есть категорические данные, и мы можем преобразовать их в целое число, пока это хорошо. Однако зачем нужна двоичная кодировка?

Я должен проверить ответ на Почему одно горячее кодирование улучшает производительность машинного обучения? Тем не менее, это все еще не ясно. Он говорит, что мы можем получить их собственные веса, но не было ли это возможно, даже если бы мы имели целочисленное значение?

1 Ответ

0 голосов
/ 07 сентября 2018

Если вы кодируете, т.е. категориальные переменные A, B, C, в целые числа 1, 2, 3, многие классификаторы «предполагают», что A (= 1) меньше чем B (= 2) или C (= 3). Это просто неверное предположение об отношении ваших категорий.

Поэтому вам нужно одно горячее кодирование.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...