учитывать неоднородность дисперсии (гетероскедастичности) в статсмоделях ANOVA - PullRequest
0 голосов
/ 22 февраля 2019

Приветствие сообществу.

Я использую statsmodels для проведения ANOVA, и одной из предпосылок ANOVA является то, что независимые переменные должны иметь равные отклонения.

Яиспользуя тест Левена через scipy, чтобы проверить наличие эффекта (я применяю тест в каждой из групп всех независимых переменных).

Я обнаружил, что у statsmodels есть опцияэто должно объяснить этот эффект (или это только мое понимание).Что я делаю сейчас, так это то, что если тест отрицательный (р> 0,05, присутствует гетероскедастичность), я использую следующую реализацию:

model = smf.ols(formula=eq, data=data).fit(cov_type='HC3')

, чтобы соответствовал , а затемanova with:

anova_table = sm.stats.anova_lm(model, typ=2, robust='HC3')

Мой вопрос заключается в том, правильно ли я понимаю, что делает этот параметр, и если да, могу ли я доверять результатам ANOVA при его использовании.Документация практически отсутствует.

заранее спасибо

...