Ошибка: ValueWarning: индекс даты предоставлен, но он не имеет связанной информации о частоте и поэтому будет игнорироваться, например, при прогнозировании - PullRequest
0 голосов
/ 22 октября 2019

Итак, у меня есть CSV-файл с двумя столбцами: дата и цена, но когда я попытался использовать ARIMA для этого временного ряда, я столкнулся с этой ошибкой:

ValueWarning: был предоставлен индекс даты, но он не имеет соответствующей информации о частоте и поэтому будет игнорироваться, например, при прогнозировании.
'игнорируется, например, при прогнозировании.', ValueWarning)

, поэтому я нашел следующие два вопроса:

Предупреждение о значении: информация о частоте не была предоставлена, поэтому будет использоваться предполагаемая частота MS

https://stackoverflow.com/a/35860703

, но когда я попытался запустить код в примере (2-я ссылка):

import pandas as pd
from statsmodels.tsa.arima_model import ARMA

df=pd.DataFrame({"val": pd.Series([1.1,1.7,8.4 ], 
                 index=['2015-01-15 12:10:23','2015-02-15 12:10:23','2015-03-15 12:10:23'])})
print df
'''
                     val
2015-01-15 12:10:23  1.1
2015-02-15 12:10:23  1.7
2015-03-15 12:10:23  8.4
'''

print df.index

'''
Index([u'2015-01-15 12:10:23',u'2015-02-15 12:10:23',u'2015-03-15 12:10:23'], dtype='object')

'''

df.index = pd.DatetimeIndex(df.index)
print df.index
'''
DatetimeIndex(['2015-01-15 12:10:23', '2015-02-15 12:10:23',
               '2015-03-15 12:10:23'],
              dtype='datetime64[ns]', freq=None)
'''

model = ARMA(df["val"], (1,0))
print model

Я также получил то же значение ValueWarning, поэтому я попытался изменить эту строку:

df.index = pd.DatetimeIndex(df.index)

на эту:

df.index = pd.DatetimeIndex(df.index.values, freq=df.index.inferred_freq)

но затем я получаю эту ошибку:

AttributeError: у объекта 'Index' нет атрибута 'inferred_freq'

1 Ответ

1 голос
/ 22 октября 2019

Ваш текущий индекс, как напечатано, является строковым индексом. Вы должны преобразовать его в DatetimeIndex и передать частоту на to_period:

df.index = pd.DatetimeIndex(df.index).to_period('M')
...