Ошибка статистической модели OLS 'inf или NaN', когда в наборе данных ее нет - PullRequest
0 голосов
/ 27 ноября 2018

Мои данные выглядят так:

58.445355   97.668693   126.101506  192.417611  221.809156  289.785785  t0  x5
60.451638   101.626297  130.027950  191.922363  219.977219  296.777197  11  x88
61.961283   104.692036  132.872274  197.605787  225.731945  313.789832  t2  x4

Столбцы имеют значения от num1 до num6, а затем t и x

import statsmodels.api as sm
from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm

formula = 'num4 ~ C(t) + C(x) + C(t):C(x)'
model = ols(formula, data).fit()

aov_table = sm.stats.anova_lm(model, typ=2)

Это приводит кэто ошибка :

ValueError: array must not contain infs or NaNs

Хотя в моем фрейме данных нет ни Infs, ни NAN.

Что я делаю не так?

PS Я успешно провел точный анализ с использованием функции aov в R, не сталкиваясь с какими-либо проблемами.

Диагноз

data.isnull().sum()

num1            0
num2            0
num3            0
num4            0
num5            0
num6            0
t               0
x               0
dtype: int64
...