Суммарные значения OLS меняются при каждом запуске - PullRequest
0 голосов
/ 02 ноября 2019

Я новичок в анализе данных. Я запускаю OLS с несколькими X. Модель в порядке генерации, но я получаю другое значение R2 и изменяет независимую переменную при каждом запуске.

Изменение в R2 очень маленький битовый коэффициент или P> | t |для независимых переменных сильно различаются. Это ожидается? Если нет, то что я делаю не так?

X = train[['GarageCars','YearBuilt']]
y = train["SalePrice"]
X = sm.add_constant(X) 
model_1 = sm.OLS(y, X).fit()
predictions_1 = model_1.predict(X)

X1 = test[['GarageCars','YearBuilt']]
y1 = test["SalePrice"]
X1 = sm.add_constant(X) 
predictions_2 = model_1.predict(X1)
model_1.summary()```

thanks

1 Ответ

0 голосов
/ 02 ноября 2019

Ааа нашел это. Я снова разделял данные каждый раз, когда запускал код модели.

...