Я не уверен, смогу ли я использовать свои закодированные данные. Я использовал два метода кодирования в своем наборе данных. Среднее / Целевое / Правдоподобное кодирование и кодирование меток. Теперь функции находятся на шкале различий, но я не могу просто нормализовать / стандартизировать их. Они категоричны. Я пытаюсь построить модель линейной регрессии, и да, целевая переменная является непрерывной.
- Могу ли я кодировать фрагменты данных разными способами?
- Что мне делать, если я имели непрерывные предикторы?
- Как вы определяете важность признака в категориальных данных, которые являются номинальными / порядковыми?