Вы не должны использовать одну горячую кодировку, так как вы используете модель случайного леса.Радиочастотная модель также сможет находить шаблоны из кодирования меток, и в целом радиочастотные модели работают хуже с одним горячим кодированием, так как они могут решить потерять несколько дней при создании дерева.Также одно горячее кодирование вводит проклятие размерности в ваших данных, что никогда не годится.
Одно горячее кодирование лучше в случаях таких методов, как линейная регрессия или логистическая регрессия, где 1, т. Е. Понедельник, может получить большее значение, чем 6то есть в субботу, поскольку у этих моделей есть модель умножения на бэкэнде.