Я хочу запустить регрессию в statsmodels, которая использует категориальные переменные и кластеризованные стандартные ошибки.
У меня есть набор данных со столбцами: учреждение, лечение, год и регистрация.Лечение - это пустышка, учреждение - это строка, а остальные - числа.Я убрал все нулевые значения.
df.dropna()
reg_model = smf.ols("enroll ~ treatment + C(year) + C(institution)", df)
.fit(cov_type='cluster', cov_kwds={'groups': df['institution']})
Я получаю следующее:
ValueError: Веса и список не имеют одинаковую длину.
Есть ли способ исправить это, чтобы мой стандартный кластер ошибок?