Сумма невязок реципиентной модели - PullRequest
0 голосов
/ 28 июня 2018

Я изучаю статистику с python, есть практический практический вопрос, на котором я застрял. Это связано с регрессией Пуассона и вот формулировка проблемы: -

Выполните следующие задачи:

  1. Загрузить набор данных R Insurance из пакета MASS и захватить данные как кадр данных pandas
  2. Построить регрессионную модель Пуассона с независимая переменная, держатели и зависимая переменная
  3. Установите модель с данными.
  4. Найти сумму невязок .

Я застрял в пункте 4 выше. Кто-нибудь может помочь с этим шагом?

Вот что я сделал до сих пор: -

import statsmodels.api as sm
import statsmodels.formula.api as smf
import numpy as np
df = sm.datasets.get_rdataset('Insurance', package='MASS', cache=False).data
poisson_model = smf.poisson('np.log(Holders) ~ -1 + Claims', df)
poisson_result = poisson_model.fit()
print(poisson_result.summary())

Here is the output so far :-

Теперь, как получить сумму остатков?

Ответы [ 2 ]

0 голосов
/ 29 июня 2018

np.sum (poisson_result.resid)

отлично работает

Вы использовали неправильные переменные для построения модели Пуассона, как указал Картикеян. Используйте это вместо

poisson_model = smf.poisson ('Claims ~ np.log (Holders)', df)

0 голосов
/ 28 июня 2018

в выражении poisson_model = smf.poisson ('np.log (Holders) ~ -1 + Claims', df) зависимая переменная "Claims" должна находиться в правой части

poisson_model = smf.poisson ('Claims ~ np.log (Holders) -1', df)

...