Можно ли получить модель взаимодействия ТОЛЬКО в R с вмененными данными? - PullRequest
0 голосов
/ 04 мая 2018

Я хотел бы указать модель, включающую ТОЛЬКО термин взаимодействия (между двумя категориальными переменными) в регрессию, используя R.

Данные были вменены с использованием MICE.

Модель выглядит примерно так:

              fit=with(data=imp, lm(Y~A*B))

вместо:

              fit=with(data=imp, lm(Y~A+B+A*B))

Конечно, обе модели дают один и тот же результат, который включает два основных эффекта и эффекты взаимодействия для всех уровней категориальных переменных.

Есть ли способ вызвать модель ТОЛЬКО ИНТЕРЦЕПТ, чтобы я мог получить хи-квадрат LR для члена в R?

С радостью предоставим любую другую необходимую вам информацию.

ОБНОВЛЕННЫЙ ВЫХОД ДЛЯ

               fit=with(data=imp, lm(Y~A+B+A*B)) 

                 est        se          t       df     Pr(>|t|)       
 (Intercept)    0.3425228 0.1762006  1.9439361 255.8431 0.0529994367 
  A2           -0.1345402 0.2227383 -0.6040284 341.5315 0.5462257933  
  A3           -0.6581980 0.1999631 -3.2915965 279.1284 0.0011243787  
  A4           -0.5027917 0.2059671 -2.4411255 339.3560 0.0151521258 
  A5           -0.4467593 0.2774011 -1.6105175 247.5980 0.1085590048 
  B2           -0.6132881 0.3177545 -1.9300690 309.3768 0.0545122193 
  A2:B2         0.8859492 0.4109083  2.1560752 339.6231 0.0317795829 
  A3:B2         1.2385945 0.3724444  3.3255827 331.7505 0.0009811451  
  A4:B2         1.0152149 0.3903675  2.6006649 312.3651 0.0097468231  
  A5:B2         0.9094596 0.4441705  2.0475463 307.5421 0.0414537211  

ОБНОВЛЕНИЕ С ИСПОЛЬЗОВАНИЕМ ПРЕДЛАГАЕМОГО КОДА:

            fit=with(data=imp, lm(Y~A:B))
  • A - 5-уровневая переменная, B - двоичная (0, 1)
  • A: B не учитывает основные эффекты и производит все уровни категориальных предикторов (вместо n-1)

Вопрос:

  • Сводка (pool (fit)) не работает, когда используется A: B; поэтому создается отдельный вывод для каждого вмененного данных. Вопрос: есть ли возможность объединить все вмененные множества, когда вызывается только A: B?

       ## summary of imputation 20 :
    
       Call:
       lm(formula = Y ~ A:B)
    
       Residuals:
          Min      1Q  Median      3Q     Max 
       -2.1975 -0.6907 -0.1208  0.5958  3.9214 
    
      Coefficients: (1 not defined because of singularities)
               Estimate Std. Error t value Pr(>|t|)  
     (Intercept)  0.12818    0.21814   0.588   0.5571  
           A1:B0  0.17252    0.27345   0.631   0.5285  
           A2:B0  0.07246    0.25964   0.279   0.7803  
           A3:B0 -0.46319    0.23698  -1.955   0.0513 .
           A4:B0 -0.32374    0.24517  -1.320   0.1874  
           A5:B0 -0.27642    0.29536  -0.936   0.3499  
           A1:B1 -0.45623    0.33321  -1.369   0.1717  
           A2:B1  0.35042    0.30480   1.150   0.2510  
           A3:B1  0.21691    0.27491   0.789   0.4306  
           A4:B1  0.13749    0.29015   0.474   0.6359  
            A5:B1       NA         NA      NA       NA  
           ---
      Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
    
       Residual standard error: 0.9755 on 400 degrees of freedom
       Multiple R-squared:  0.08071,   Adjusted R-squared:  0.06003 
      F-statistic: 3.902 on 9 and 400 DF,  p-value: 9.099e-05
    
...