Панды дают разные результаты для разных машин - PullRequest
0 голосов
/ 02 июня 2018

Когда я обновил numpy 1.9 до 1.10, я начал видеть, что следующая модель регрессии дает разные результаты на разных машинах с одинаковой конфигурацией оборудования:

fitted_model = pd.ols(y=lhs_unpickled, x=rhs_unpickled, intercept=False)
print fitted_model.beta

lhs_unpickled и rhs_unpickled выглядят какthis:

> lhs_unpickled[1:5]
2008-04-24 00:18:00+00:00   -0.465517
2008-04-24 00:33:00+00:00   -0.519584
2008-04-24 00:48:00+00:00   -0.607410
2008-04-24 01:03:00+00:00   -0.705983
Freq: 15T, Name: AI_Index, dtype: float64

> rhs_unpickled[1:5]
                                CPM       XQH       FOD        EX
2008-04-24 00:18:00+00:00 -0.301556  0.148582  0.079320 -0.707586
2008-04-24 00:33:00+00:00 -0.274421  0.071747  0.130182 -0.659409
2008-04-24 00:48:00+00:00 -0.273960 -0.001447  0.148643 -0.703215
2008-04-24 01:03:00+00:00 -0.238426 -0.008732  0.130801 -0.698489

Есть ли что-то конкретное в этой функции pd.ols(), которая приводит к этому противоречивому поведению при использовании numpy 1.10?

...