Почему значение перехвата установлено в 1? - PullRequest
1 голос
/ 04 октября 2019

Я изучаю основы линейной регрессии и как построить ее на Python. В моем учебном материале у меня есть фрейм данных, содержащий информацию о ценах и размерах домов. В материале говорится, что перед передачей этой информации в OLS-метод в stats models.api мне нужно определить новый столбец с именем «intercept», где единственным значением является 1. Почему я должен это сделать ипочему значение перехвата должно быть 1? Я думал, что значение пересечения определено позже, ПОСЛЕ того, как линейная регрессия была запрограммирована Python?

Вот мой фрейм данных:

    price   area
0   598291  1188
1   1744259 3512
2   571669  1134
3   493675  1940
4   1101539 2208

А вотРешение, предлагаемое в моем учебном материале:

df['intercept'] = 1
lm = sm.OLS(df.price, df[['intercept', 'area']])
results = lm.fit()
results.summary()
...