Я пытаюсь реализовать линейную модель на категориальных данных.
Мой набор данных состоит из категориальных предикторов, а моя цель - количественная величина.
Работает линейная модель:
linearMod <- lm(Y~. -1, data=df_filter)
Когда я извлекаю коэффициенты:
linearMod$coefficients
Я получаю длинный список коэффициентов переменных-модальностей.
Некоторые из модальностей имеют значение NA ... это просто прекрасно, и я понимаю это.
Тем не менее, некоторые переменные-модальности не появляются в выводе коэффициентов linearMod $.
Я мог бы понять, были ли они установлены на «NA», но отсутствие их в этом списке выглядит странно для меня.
Вопрос: Нормально ли это поведение, и если да, то каково объяснение этого явления?
Альтернативный вопрос: я где-то читал, что есть много способов сделать фиктивное кодирование ... но больше нет способа его найти ... у вас есть URL / ссылка для этого?
Спасибо за ваши ответы.