о фиктивных переменных в г - PullRequest
0 голосов
/ 19 января 2019

Я новичок в языке R, для моего задания я пытаюсь сгенерировать манекены нескольких уровней для разных переменных (всего в 3).Тем не менее, каждый подход, который я получил проблему:

method1: затем https://stats.idre.ucla.edu/r/modules/coding-for-categorical-variables-in-regression-models/ Код:

> housing_prices2$Fuel.Type.f <- factor(housing_prices2$Fuel.Type)
> is.factor(housing_prices2$Fuel.Type.f)
[1] TRUE
> housing_prices2$Fuel.Type.f[1:10]
 [1] Electric Gas      Gas      Gas      Gas      Gas      Oil     
 [8] Oil      Electric Gas     
Levels: Electric Gas None Oil Solar Unknown/Other Wood

работает хорошо.Однако, когда у меня возникла проблема в следующей строке:

> summary(lm(write ~ Fuel.Type.f, data = housing_prices2))  
Error in model.frame.default(formula = write ~ Fuel.Type.f, data = housing_prices2,:          object is not a matrix

Я просто понятия не имею об этой ошибке, и она не имеет смысла для меня, поэтому я решил использовать другой метод;

method2: за ним следует Преобразовать категориальные переменные в числовые в R

для переменной Fuel.Type, она работает хорошо:

> Fuel.Type <- as.factor(c("Electric", "Gas", "None", "Oil", "Solar", "Unknown/Other",
+                          "Wood"))
> Fuel.Type
[1] Electric      Gas           None          Oil           Solar        
[6] Unknown/Other Wood         
Levels: Electric Gas None Oil Solar Unknown/Other Wood
> unclass(Fuel.Type)
[1] 1 2 3 4 5 6 7
attr(,"levels")
[1] "Electric"      "Gas"           "None"          "Oil"          
[5] "Solar"         "Unknown/Other" "Wood"         

, но когда я пытаюсь сгенерировать фиктивные переменныедля других переменных, тогда я получил эту ошибку:

> housing_prices2$Heat.Type.f[1:10]
NULL
Warning message:
Unknown or uninitialised column: 'Heat.Type.f'. 

Я не имею ни малейшего понятия о том, что происходит с этой ошибкой ... любые предложения приветствуются!

Кстати, вот мой пример таблицы данных:

>$ Fuel.Type    : chr  "Electric" "Gas" "Gas" "Gas"

>$ Heat.Type    : chr  "Electric" "Hot Water" "Hot Water" "Hot Air"

>$ Sewer.Type   : chr  "Private" "Private" "Public" "Private"

1 Ответ

0 голосов
/ 19 января 2019

Я выяснил свою проблему прошлой ночью. Проблема в том, что я испортил файл данных, так как я создаю новый файл данных с именем:

hp2 <- read_excel("Desktop/hw/424/hw1/housing_prices2.xlsx")

Кроме того, я испортил и переменную Y, см.

summary(lm(write ~ Fuel.Type.f, data = housing_prices2))  

Моя переменная Y фактически не записывается.

...