Я запускаю следующий код для генерации регрессионных моделей
library (dplyr)
fitted_models <- df %>%
group_by(sic, fyear) %>%
do (model = lm (TACCdTA ~ Inverse_TA + DeL_RevRec + PPEdTA , data = .))
Затем, чтобы получить коэффициенты для каждого sic и fyear, я запускаю следующий код
library(broom)
fitted_models %>% tidy(model)
Я получил коэффициенты длякаждый sic за каждый год .
Теперь мой вопрос - под каждым sic для каждого год существует много наблюдений (например, 1000 наблюдений) - как я могу рассчитать подходящее значение для каждогонаблюдение под каждым sic и fyear с использованием коэффициентов, сгенерированных моделью (ами) выше.
Еще один маленький вопрос - для моего первого кода, в котором я запускаю модель, как я могу убедиться, что модель (-ы) запущена (-ются) только для случаев, в которых каждый sic и комбинация fyear (sic-fyear) имеет не менее 10 наблюдений.