Расчет предельных эффектов по прогнозируемым вероятностям объекта модели zeroinfl () - PullRequest
0 голосов
/ 23 февраля 2020

На этом графике, который я ранее создал, показаны прогнозируемые вероятности появления претензии на основе двух переменных, PIB (в масштабе оси X) и W, представленные в виде его 75-го и 25-го процентилей. Доверительные интервалы для прогнозов представлены рядом с двумя строками.

Вероятность возникновения заявки

Поскольку я предполагаю, что W и PIB оказывают интерактивное влияние на начало заявки, я Хотелось бы посмотреть, есть ли какое-либо значение в предельном влиянии W на PIB. Доверительные интервалы только для предсказанных вероятностей не могут подтвердить, что этот эффект незначителен, согласно моему прочтению здесь (https://www.sociologicalscience.com/download/vol-6/february/SocSci_v6_81to117.pdf).

Я знаю, что вы можете легко рассчитать предельный эффект на основе предсказанных вероятностей, вычитая одно из другого. Тем не менее, я не понимаю, как я могу получить доверительные интервалы для предельного эффекта - очевидно, необходимо определить, когда и где мои два набора вероятностей действительно значительно отличаются друг от друга.

Функция, которую я использовал для расчета прогнозируемых вероятностей объекта модели zeroinfl () и доверительных интервалов этих прогнозируемых вероятностей, получена из онлайн-публикации (https://stat.ethz.ch/pipermail/r-help/2008-December/182806.html). Я рад предоставить больше кода, если это необходимо, но так как это не вопрос об ошибке, я не уверен, что она нужна.

1 Ответ

0 голосов
/ 25 февраля 2020

Итак, я не совсем уверен, что это правильный ответ, но для любого, кто может столкнуться с той же проблемой, что и я:

Если предположить, что две строки прогноза поддерживают одинаковую дисперсию, вы можете объединить SE, прежде чем рассчитывать. См. Википедию для Pooled Variance для подтверждения.

SEpooled <- ((pred_1_OR_pred_2$SE * sqrt(simulation_n))^2) * (sqrt((1/simulation_n)+(1/simulation_n)))
low_conf <- (pred_1$PP - pred_2$PP) - (1.96*SEpooled)
high_conf <- (pred_1$PP - pred_2$PP) + (1.96*SEpooled)

##Add this to the plot
lines(pred_1$x_val, low_conf, lty=2)
lines(pred_1$x_val, high_conf, lty=2)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...