Правильный способ использования пакета опроса для взвешенной логистической регрессии - PullRequest
0 голосов
/ 03 июля 2019

Я пытаюсь выполнить взвешенную логистическую регрессию на данных опроса.Мои веса варьируются от 40 до 130. Весы основаны на респондентах и ​​являются фактором продаж автомобилей, демографических факторов и т. Д.

Когда я пытаюсь запустить взвешенный LR с помощью glm, я получаю точность 1%.Когда я попытался изменить базу весов, разделив все веса на 100, точность возросла до 57%.Тогда я также попробовал "обзорный" пакет.Но я не мог запустить итерации, используя функцию "step".Поэтому я попытался смешать пакет GLM и опрос.Я начал с создания опроса с пакетом опроса.Затем инициировали модель NULL с помощью опроса.После этого я запустил итерации с помощью функции "step" и, наконец, использовал переменные из последней итерации в функцию "svyglm" пакета опроса, чтобы получить окончательные оценки.Но с этим я не получаю никаких остатков, поэтому у меня нет никакого способа получить точность.

library(magrittr)
library(survey)


data1 <- read.csv("weighted sample 2.csv")

# Creating survey design in SURVEY
my_svy <- svydesign(data = data1,ids = ~1, weights = ~WGT_REG)

# Initiating NULL model in GLM
logr<-glm(output ~ 1,data=data1,family="binomial")

# Running iteration using GLM
logrstep<-step(logr,direction = "both",scope = formula(data1))

# Running final model using SURVEY
logr_survey <- svyglm(output ~ (all variables from last iteration in step function), design=my_svy, family = "binomial")
summary(logr_survey)

Вопрос

1) Я хочу знать, еслиподход смешивания двух пакетов является неправильным или правильным?ИЛИ Правильно ли использовать изменение базы весов?

2) Должны ли весовые коэффициенты для взвешенной регрессии всегда быть <1?Также предложите какой-нибудь лучший способ для проведения взвешенного LR? </p>

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...