Как использовать фиктивную переменную в lm () как зависимую переменную? - PullRequest
0 голосов
/ 21 апреля 2019

Я импортировал два файла CSV, которые содержат одни и те же переменные в два разных времени. Затем мне удалось создать новый третий CSV-файл с помощью функции rbind (). Я попытался создать линейную регрессию с помощью функции lm (), тогда как время используется в качестве фиктивной переменной. Другие переменные являются числовыми, я изменил их по категориям на числовые. Вывод показывает некоторые переменные как числовые и другие по категориям, что подозрительно для меня. Я хотел бы взять среднее значение переменных и построить их относительно фиктивной переменной, где я всегда получаю сообщение об ошибке, что длина переменной различна.

Я уже попробовал функцию glm () и взял среднее значение для каждой переменной. Я также определил переменные как числовые.

gh_old_small_short <- read.csv(file.choose(), header=T, sep=";")
gh_new_small_short <- read.csv(file.choose(), header=T, sep=";")
ghold <- rbind(gh_old_small_short, gh_new_small_short,  fill=T)
names(gh_new_small_short) <- names(gh_old_small_short)
model1 <- lm(formula = dummy ~ GovernmentOfficials + OfficeOfPresidency + MembersOfParliament + Age +
            Police + TaxOfficials + JudgesAndMagistrates + FightingCorruption, data=ghold, na.rm=T)
summary(model1)

Я ожидаю таблицу линейной регрессии, которая включает каждую переменную в целом, а не каждую опцию ответа в отдельности, потому что я восстановил переменные как числовые.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...