Как закодировать аргумент «новые данные» таким образом, чтобы он предсказывал результат на всех уровнях категориальной переменной? - PullRequest
0 голосов
/ 29 апреля 2020

Пример данных:

вес (число c, кгс)

возраст (число c, годы)

цвет (категориальный, 2 уровня, черный / белый)

тип (категориальный, 2 уровня, кошка / собака)

модель

lm(formula = weight ~ age + color + type, data = df)

Меня интересуют прогнозы для типа для любых цветов и среднего возраста. Однако следующие аргументы новых данных не объединяют уровни color вместе.

newdata = list(age = mean(df$age), color = c("black", "white"), type = c("cat", "dog")

Последний дает прогнозы для черных кошек и белых собак .

newdata2 = expand.grid(age = mean(df$age), color = c("black", "white"), type = c("cat", "dog")

Последний дает прогнозы для всех комбинаций уровней категориальных переменных:

черные кошки

белые кошки

черные собаки

белые собаки

Я хотел бы получить прогнозы для кошек и собак любого цвета и среднего возраста. Как мне это кодировать?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...