Линейная регрессия с функцией сдвига в Python - PullRequest
0 голосов
/ 15 декабря 2018

У меня есть две переменные: Производство (у) и Рог (х).Буровые установки вызывают добычу, но установки также ведут добычу с 20 периодами времени (существует время задержки в 20 периодов от начала бурения до производства)

Код :

import statsmodels.formula.api as smapi

m1 = smapi.OLS.from_formula('Production ~ Rigs.shift(20)', df).fit()

df['Forecast'] = m1.fittedvalues

Моя проблема:

Когда я запускаю регрессию, описанную выше, я не получаю прогнозных значений в будущем.Так как у меня есть счет буровой установки сегодня, я должен быть в состоянии предсказать производство 20 периодов в будущем.Какой код я должен использовать в Python / Pandas, чтобы сделать это возможным?

С уважением

1 Ответ

0 голосов
/ 15 декабря 2018

Согласно тому, что я вижу на этой диаграмме рассеяния данных, что-то происходит, что, по-видимому, отсутствует в анализе.Начиная с нижнего левого угла, наблюдается устойчивое и легко смоделированное увеличение до приблизительно Rigs = 1600, когда данные резко сдвигаются влево, а затем снова повторяется шаблон «устойчивого увеличения».Этот резкий сдвиг очень велик и может иметь единственную причину.scatterplot

...