Я новичок в языке R, для моего задания я пытаюсь сгенерировать манекены нескольких уровней для разных переменных (всего в 3).Тем не менее, каждый подход, который я получил проблему:
method1: затем https://stats.idre.ucla.edu/r/modules/coding-for-categorical-variables-in-regression-models/ Код:
> housing_prices2$Fuel.Type.f <- factor(housing_prices2$Fuel.Type)
> is.factor(housing_prices2$Fuel.Type.f)
[1] TRUE
> housing_prices2$Fuel.Type.f[1:10]
[1] Electric Gas Gas Gas Gas Gas Oil
[8] Oil Electric Gas
Levels: Electric Gas None Oil Solar Unknown/Other Wood
работает хорошо.Однако, когда у меня возникла проблема в следующей строке:
> summary(lm(write ~ Fuel.Type.f, data = housing_prices2))
Error in model.frame.default(formula = write ~ Fuel.Type.f, data = housing_prices2,: object is not a matrix
Я просто понятия не имею об этой ошибке, и она не имеет смысла для меня, поэтому я решил использовать другой метод;
method2: за ним следует Преобразовать категориальные переменные в числовые в R
для переменной Fuel.Type, она работает хорошо:
> Fuel.Type <- as.factor(c("Electric", "Gas", "None", "Oil", "Solar", "Unknown/Other",
+ "Wood"))
> Fuel.Type
[1] Electric Gas None Oil Solar
[6] Unknown/Other Wood
Levels: Electric Gas None Oil Solar Unknown/Other Wood
> unclass(Fuel.Type)
[1] 1 2 3 4 5 6 7
attr(,"levels")
[1] "Electric" "Gas" "None" "Oil"
[5] "Solar" "Unknown/Other" "Wood"
, но когда я пытаюсь сгенерировать фиктивные переменныедля других переменных, тогда я получил эту ошибку:
> housing_prices2$Heat.Type.f[1:10]
NULL
Warning message:
Unknown or uninitialised column: 'Heat.Type.f'.
Я не имею ни малейшего понятия о том, что происходит с этой ошибкой ... любые предложения приветствуются!
Кстати, вот мой пример таблицы данных:
>$ Fuel.Type : chr "Electric" "Gas" "Gas" "Gas"
>$ Heat.Type : chr "Electric" "Hot Water" "Hot Water" "Hot Air"
>$ Sewer.Type : chr "Private" "Private" "Public" "Private"