Resampling - Pandas Python - PullRequest
       10

Resampling - Pandas Python

0 голосов
/ 16 октября 2019

Я пытаюсь прогнозировать временные ряды розничных продаж, используя python. Набор данных содержит следующие атрибуты: [Дата заказа Режим доставки Сегмент Идентификатор клиента Категория Идентификатор продукта Название продукта Объем продаж Скидка Прибыль]. Здесь я импортировал набор данных и проиндексировал данные временных рядов

prdct1 = prdct1.groupby('Order Date')['Sales'].sum().reset_index()
prdct1 = prdct1.set_index('Order Date')
prdct1.index

Для указанного кода был отображен индекс даты и времени. Когда я пытаюсь пересчитать среднюю ежедневную стоимость продаж для начала каждого месяца как отметку времени,

y = prdct1['Sales'].resample('MS').mean()

я получаю следующую ошибку:

Only valid with DatetimeIndex, TimedeltaIndex or PeriodIndex, but got an instance of 'Index'

Может ли кто-нибудь помочь?

1 Ответ

0 голосов
/ 16 октября 2019

Я думаю, вам нужно DatetimeIndex путем преобразования столбца Order Date перед вашим решением, также reset_index с set_index следует опустить:

prdct1['Order Date'] = pd.to_datetime(prdct1['Order Date'])
prdct1 = prdct1.groupby('Order Date')['Sales'].sum()

А затем:

y = prdct1.resample('MS').mean().reset_index()
...