Использование нескольких весов для lm () или glm () в R - PullRequest
0 голосов
/ 04 октября 2018

Я хочу вписать модель в R, в которой мне нужно применить два веса одновременно.Допустим, моя модель glm(y ~ x1 + male + East_Germany), где мужчина определяет пол респондента, а Восточная Германия также является бинарной переменной, проверяющей, живет ли кто-то в Восточной Германии.

Теперь предположим, что как женщины, так и восточные немцы сильно искажены в моих данных,Предполагая, что это не из-за некорректного процесса сбора данных, я должен был бы применить два веса.Но могу ли я действительно указать два веса одновременно, как это ...?glm(y ~ x1 + male + East_Germany, weight=c("male_wgt","east_wgt"))

Я думал, что применение веса one к общим данным или к общей модели уже изменяет всю структуру данных, но я могу ошибаться.Давайте приведем пример:

y   x1   male   east   male_weight   east_weight
5   4    0      1      5             2
3   2    1      1      1             2
9   7    1      0      1             1
4   8    1      0      1             1
1   3    1      0      1             1
6   4    1      0      1             1

... где male==1 означает «мужчина», а male==0 - «женщина», и мы предполагаем, что оба пола должны быть представлены одинаково (50%), игде east==1 означает «Восточная Германия», east==0 - это «Западная Германия», и здесь также для простоты предположим, что оба должны быть представлены одинаково.y и x - это просто случайные числа.

Мне интересно, как бы я применил оба веса одновременно, потому что, если я скажу «давайте посчитаем строку № 1 пять раз, чтобы женщины набрали больше веса»,В то же время я даю Восточной Германии слишком большой вес (даже не применяя east_weight).Причина в том, что если мы посчитаем строку № 1 пять раз, мы получим новое соотношение Восток-Запад 6: 4.Или я ошибаюсь?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...