Хранение и интерпретация результатов модели lm () - PullRequest
0 голосов
/ 28 сентября 2018

У меня есть данные по оценкам удовлетворенности по 5 вопросам за 3 года (с 2016 по 2018).Моя цель - определить, какой из 5 вопросов испытал тенденцию наиболее статистически значимую в сторону повышения и в сторону понижения за этот трехлетний период.

Myфиктивный фрейм данных выглядит следующим образом -

df = data.frame(Question = c('Q1','Q1','Q1','Q2','Q2','Q2','Q3','Q3','Q3','Q4','Q4','Q4','Q5','Q5','Q5'),
                Year = c('2016','2017','2018','2016','2017','2018','2016','2017','2018','2016','2017','2018','2016','2017','2018'),
                Score = c(0.8,0.6,0.2,0.2,0.4,0.8,0.4,0.5,0.4,0.1,0.2,0.1,0.9,0.7,0.3),
                Count = c(226,117,200,323,311,380,411,408,407,222,198,201,665,668,670))

Для этого я использовал функцию lm в R для создания линейной модели.

lm(Score ~ Question * as.numeric(Year), data = df)

Однако, чтобы определить наиболеезначительные восходящие и нисходящие трендовые вопросы, я думал о сохранении коэффициентов модели в кадре данных, а затем рассматривал самые высокие и самые низкие коэффициенты как мои наиболее значимые восходящие и нисходящие трендовые вопросы.

Мой первыйвопрос - Использую ли я правильный подход к тому, чего я хочу достичь?

И мой второй вопрос - Если я использую правильный подход, как я могу сохранить этиэффективность в кадре данных и отфильтровывать верхнее и нижнее значения?

Любая помощь по этому вопросу будет высоко оценена.

1 Ответ

0 голосов
/ 28 сентября 2018

Если вы сохраняете свою модель, вы можете извлекать коэффициенты и другие элементы, как если бы вы были из блока данных.

Пример:

y = as.numeric(c("1","2","3","4","5"))
x = as.numeric(c("5","6","3","10","12"))
model=lm(y~x)

model$coefficients
  (Intercept) as.numeric(x) 
    0.6350365     0.3284672 
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...