Если вы кодируете, т.е. категориальные переменные A
, B
, C
, в целые числа 1
, 2
, 3
, многие классификаторы «предполагают», что A (= 1) меньше чем B (= 2) или C (= 3). Это просто неверное предположение об отношении ваших категорий.
Поэтому вам нужно одно горячее кодирование.