Pandas частота на каждые выходные - PullRequest
0 голосов
/ 09 мая 2020

Я пытаюсь провести анализ временных рядов с использованием ARIMA с экзогенными переменными для прогнозирования тенденций преступности, но у меня возникает проблема. У меня есть свидания только на выходные, так что моя частота составляет по сути 2 записи в указателе каждую неделю, и я не могу, хоть убей, придумать, как это сделать ... какие-нибудь идеи?

Так, например, я могу делать ежедневные временные ряды без проблем

PeriodIndex(['2017-02-12', '2017-04-12', '2017-09-12', '2017-12-31',
             '2018-01-01', '2018-05-01', '2018-06-01', '2018-10-01',
             '2018-01-20', '2018-01-22',
             ...
             '2018-07-22', '2018-07-23', '2018-07-24', '2018-07-25',
             '2018-07-26', '2018-07-27', '2018-07-28', '2018-07-29',
             '2018-07-30', '2018-07-31'],
            dtype='period[D]', name='Row Labels', length=196, freq='D')

, но поскольку я пытаюсь изучить только эффект выходных, я хотел бы сосредоточиться ТОЛЬКО на Сартурде и воскресенье, поэтому Затем я могу использовать регрессию временных рядов для изучения этого ряда. Я могу сделать это УДАЛЕНИЕ переменных и сосредоточив внимание только на одной из двух ...

1 Ответ

0 голосов
/ 09 мая 2020

Я бы переделал выборку на ежедневную частоту, а затем использовал

weekend_only = df[df.index.weekday >= 5]

, где df - это pandas.DataFrame с DateTimeIndex.

Для атрибута weekday 0 -4 - понедельник-пятница, а суббота-воскресенье - 5-6.

Для получения дополнительной информации см. pandas руководство пользователя по временным рядам .

...