Я хочу вписать модель в R, в которой мне нужно применить два веса одновременно.Допустим, моя модель glm(y ~ x1 + male + East_Germany)
, где мужчина определяет пол респондента, а Восточная Германия также является бинарной переменной, проверяющей, живет ли кто-то в Восточной Германии.
Теперь предположим, что как женщины, так и восточные немцы сильно искажены в моих данных,Предполагая, что это не из-за некорректного процесса сбора данных, я должен был бы применить два веса.Но могу ли я действительно указать два веса одновременно, как это ...?glm(y ~ x1 + male + East_Germany, weight=c("male_wgt","east_wgt"))
Я думал, что применение веса one к общим данным или к общей модели уже изменяет всю структуру данных, но я могу ошибаться.Давайте приведем пример:
y x1 male east male_weight east_weight
5 4 0 1 5 2
3 2 1 1 1 2
9 7 1 0 1 1
4 8 1 0 1 1
1 3 1 0 1 1
6 4 1 0 1 1
... где male==1
означает «мужчина», а male==0
- «женщина», и мы предполагаем, что оба пола должны быть представлены одинаково (50%), игде east==1
означает «Восточная Германия», east==0
- это «Западная Германия», и здесь также для простоты предположим, что оба должны быть представлены одинаково.y
и x
- это просто случайные числа.
Мне интересно, как бы я применил оба веса одновременно, потому что, если я скажу «давайте посчитаем строку № 1 пять раз, чтобы женщины набрали больше веса»,В то же время я даю Восточной Германии слишком большой вес (даже не применяя east_weight
).Причина в том, что если мы посчитаем строку № 1 пять раз, мы получим новое соотношение Восток-Запад 6: 4.Или я ошибаюсь?