Как указано в заголовке, я пытаюсь запустить регрессию в python, где стандартные ошибки кластеризованы , а также устойчивы к гетероскедастичности и автокорреляции (HA C). Я работаю в statsmodels
(sm
), но, очевидно, открыт для использования других библиотек (например, linearmodels
).
Для кластеризации, например, по id, код будет
sm.OLS.from_formula(formula='y ~ x', data=df).fit(cov_type='cluster', cov_kwds={'groups': df['id']}, use_t=True)
Для стандартных ошибок HA C код будет
sm.OLS.from_formula(formula='y ~ x', data=df).fit(cov_type='HAC', cov_kwds={'maxlags': max_lags}, use_t=True)
Учитывая, что cov_type
не может быть одновременно cluster
и HAC
, это не кажется можно ли сделать оба в statsmodels? Это правильно, и / или есть ли другой способ иметь оба?