Использование коэффициентов из регрессионных моделей, которые используют функцию group_by - PullRequest
0 голосов
/ 25 июня 2019

Я запускаю следующий код для генерации регрессионных моделей

library (dplyr)
fitted_models <- df %>% 
  group_by(sic, fyear) %>% 
  do (model = lm (TACCdTA ~  Inverse_TA + DeL_RevRec + PPEdTA , data = .)) 

Затем, чтобы получить коэффициенты для каждого sic и fyear, я запускаю следующий код

library(broom)
fitted_models %>% tidy(model)

Я получил коэффициенты длякаждый sic за каждый год .

Теперь мой вопрос - под каждым sic для каждого год существует много наблюдений (например, 1000 наблюдений) - как я могу рассчитать подходящее значение для каждогонаблюдение под каждым sic и fyear с использованием коэффициентов, сгенерированных моделью (ами) выше.

Еще один маленький вопрос - для моего первого кода, в котором я запускаю модель, как я могу убедиться, что модель (-ы) запущена (-ются) только для случаев, в которых каждый sic и комбинация fyear (sic-fyear) имеет не менее 10 наблюдений.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...