Следует ли масштабировать числовой c категориальный признак в древовидных моделях? - PullRequest
0 голосов
/ 05 мая 2020

Я масштабирую данные для древовидных классификаторов, которые, как я знаю, не нужны (но также не должны повредить). Большинство моих функций являются количественными, но у меня также есть "day_of_week", которое я оставил как 0-6 (не фиктивный). Правильно ли масштабировать эту функцию? Или мне следует оставить его без масштабирования и добавить обратно после завершения масштабирования? Или это должно быть в фиктивном формате? Или мне следует полностью пропустить масштабирование?

Спасибо за любую помощь!

1 Ответ

0 голосов
/ 06 мая 2020

Подходы на основе дерева нечувствительны к масштабу данных и основаны исключительно на порядке, поэтому нет необходимости масштабировать ваши данные.

...