У меня есть две переменные А и В, и я делаю анализ ановы. Ниже приведены мои коды и результаты.
**Analysis 1**
Code: anova(lm(y~A+B))
Result:
Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
A 1 40.58 40.583 214.11 < 2.2e-16 ***
B 4 171.31 42.829 225.96 < 2.2e-16 ***
Residuals 1994 377.94 0.190
**Analysis 2**
Code: anova(lm(y~B+A))
Result:
Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
B 4 87.10 21.774 114.88 < 2.2e-16 ***
A 1 124.80 124.800 658.43 < 2.2e-16 ***
Residuals 1994 377.94 0.190
Из анализа 1, SS (A) = 40,58, в то время как из анализа 2, SS (A | B) = 124.80, что больше, чем SS (A) из анализ 1. Если я хочу оценить влияние A после исключения эффекта B, я должен использовать анализ 2. Однако в анализе 2 я получаю большее значение SS (A | B) и F, чем SS (A) и Значение F, полученное в результате анализа 1. Насколько я понимаю, SS (A | B) всегда должно быть меньше, чем SS (A), поскольку дисперсия, учитываемая B, убирается. Это приводит к выводу, что после учета эффекта B я получаю более значительный эффект A, что приводит меня в замешательство.