ndim Ошибка с моделью твиди Statsmodels - PullRequest
0 голосов
/ 16 апреля 2019

Я пытаюсь запустить твидовую модель со Statsmodel и продолжаю получать следующую ошибку:

AttributeError: у объекта 'Tweedie' нет атрибута 'ndim'

formula = 'pure_premium ~ atfault_model + channel_model_DIR + channel_model_IA + CLded_model + credit_model_52778 + \
        credit_model_c6 + package_model_Elite + package_model_LBO + package_model_Plus + package_model_Savers + \
        package_model_Savers_Plus + Q("ds_fp_paid_in_full_eligiable-has discount") + ds_fp_paid_in_full_ineligable + \
        Q("ds_pn_prior_insurance_eligable-has discount") + ds_pn_prior_insurance_ineligable + \
        Q("ds_ip_advanced_purchase_eligiable-has discount") + ds_ip_advanced_purchase_ineligable + \
        credit_model_c5 + ds_ad_affinity + ds_ak_alliance + \
        ds_ly_loyalty_discount + ds_mo_multipolicy + ds_pf_performance + majorvio_model + \
        (driver_age_model*marital_status_model) + minorvio_model + multi_unit_model + \
        RATING_CLASS_CODE_MODEL + unit_drv_exp_model +  Vintiles + safety_course_model + instructor_course_model + \
        (class_model*v_age_model) + (class_model*cc_model) + state_model'

lost_cost_model = smf.ols(formula = formula, data = coll_df
                          , family = sm.families.Tweedie(link = sm.families.links.log, var_power = 1.5))

Каждая переменная является категориальной, с плавающей точкой или целым числом.

Я не уверен, что является причиной этого.

1 Ответ

1 голос
/ 17 апреля 2019

ols не берет семью, OLS - это просто линейная регрессия.

Вам необходимо использовать обобщенную линейную модель, т.е. GLM или glm для интерфейса формулы.GLM включает несколько семейств в экспоненциальном семействе с одним параметром и включает выбор функций связи.

Несколько других моделей эквивалентны GLM, но основаны на другой реализации и с другими опциями.Эти модели написаны для конкретных комбинаций семейных связей и не имеют возможности изменить их.

OLS - GLM с семейством Гаусса, а линейная связь
Logit - GLM с семейством биномов,ссылка logit и только для двоичных переменных ответа.
Proit - это GLM с семейством биномов, пробитовой связью и только для двоичных переменных ответа.
Poisson - GLM с семейством Пуассона и ссылкой для журнала
NegativeBinomial это более общая версия GLM с семейством NegativeBinomial и лог-ссылкой.discrete.NegativeBinomial допускает несколько параметризаций подразумеваемой функции дисперсии и оценивает параметр дисперсии вместе со средними параметрами как MLE.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...