Когда я обновил numpy 1.9 до 1.10, я начал видеть, что следующая модель регрессии дает разные результаты на разных машинах с одинаковой конфигурацией оборудования:
fitted_model = pd.ols(y=lhs_unpickled, x=rhs_unpickled, intercept=False)
print fitted_model.beta
lhs_unpickled
и rhs_unpickled
выглядят какthis:
> lhs_unpickled[1:5]
2008-04-24 00:18:00+00:00 -0.465517
2008-04-24 00:33:00+00:00 -0.519584
2008-04-24 00:48:00+00:00 -0.607410
2008-04-24 01:03:00+00:00 -0.705983
Freq: 15T, Name: AI_Index, dtype: float64
> rhs_unpickled[1:5]
CPM XQH FOD EX
2008-04-24 00:18:00+00:00 -0.301556 0.148582 0.079320 -0.707586
2008-04-24 00:33:00+00:00 -0.274421 0.071747 0.130182 -0.659409
2008-04-24 00:48:00+00:00 -0.273960 -0.001447 0.148643 -0.703215
2008-04-24 01:03:00+00:00 -0.238426 -0.008732 0.130801 -0.698489
Есть ли что-то конкретное в этой функции pd.ols()
, которая приводит к этому противоречивому поведению при использовании numpy 1.10?