Возможная проблема регрессии категориальных данных в машинном обучении - PullRequest
0 голосов
/ 06 августа 2020

Я не уверен, смогу ли я использовать свои закодированные данные. Я использовал два метода кодирования в своем наборе данных. Среднее / Целевое / Правдоподобное кодирование и кодирование меток. Теперь функции находятся на шкале различий, но я не могу просто нормализовать / стандартизировать их. Они категоричны. Я пытаюсь построить модель линейной регрессии, и да, целевая переменная является непрерывной.

  • Могу ли я кодировать фрагменты данных разными способами?
  • Что мне делать, если я имели непрерывные предикторы?
  • Как вы определяете важность признака в категориальных данных, которые являются номинальными / порядковыми?
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...