Я изучаю основы линейной регрессии и как построить ее на Python. В моем учебном материале у меня есть фрейм данных, содержащий информацию о ценах и размерах домов. В материале говорится, что перед передачей этой информации в OLS-метод в stats models.api мне нужно определить новый столбец с именем «intercept», где единственным значением является 1. Почему я должен это сделать ипочему значение перехвата должно быть 1? Я думал, что значение пересечения определено позже, ПОСЛЕ того, как линейная регрессия была запрограммирована Python?
Вот мой фрейм данных:
price area
0 598291 1188
1 1744259 3512
2 571669 1134
3 493675 1940
4 1101539 2208
А вотРешение, предлагаемое в моем учебном материале:
df['intercept'] = 1
lm = sm.OLS(df.price, df[['intercept', 'area']])
results = lm.fit()
results.summary()