Я анализирую набор данных с помощью glm ().На остаточном графике показана явная гетероскидастичность (см. Ссылку ).
Я пытаюсь решить это с помощью двухэтапной регрессии wls (взвешенного наименьшего квадрата), но остаточный график все еще показывает непостоянные различные.Проблема может заключаться в том, что я неправильно определил вес.
model_1 <- glm(log(Y) ~ X1 + X2 + X3 + X4 + X5 + X6 + X7,
data = train, family = gaussian(link = "log"))
w = 1/(model_1$residuals)^2
glm_wls <- glm(log(Y) ~ X1 + X2 + X3 + X4 + X5 + X6 + X7,
data = train, family = gaussian(link = "log"),
weights = w)
Я ожидаю, что модель glm_wls может решить эту проблему, но я не думаю, что я правильно понял w.