Как я могу повторно сэмплировать (увеличить) мой Pandas Dataframe? - PullRequest
0 голосов
/ 12 ноября 2018

У меня есть небольшой DataFrame Pandas, который я хотел бы сделать повторно, и я надеялся, что вы мне поможете:)

Я не могу показать это вам, поскольку это конфиденциально, но я могу описать вам более простую версию.

Имеет 4 столбца:

-Дата (в формате ГГГГ-ММ-ДД)

-Деревенский

-Amount

-Частота

Итак, вот что я хотел бы сделать:

В зависимости от рядов, частота составляет год или месяц Если это происходит ежемесячно, то ничего не нужно делать.

Но если это ГОД, я хотел бы изменить его на ЕЖЕМЕСЯЧНО и вставить 11 новых строк, чтобы в рассматриваемых 12 строках (существующий и 11 новых) страна оставалась прежней (с таким же названием страны) повторяется 12 раз), сумма будет равна сумме / 12 (повторяется также и 12 раз, вы получите ее), и дата будет увеличиваться на 1 месяц в каждой строке.

Мне бы очень хотелось, чтобы кто-нибудь помог мне с этим!

Заранее спасибо,

Alex

EDIT:

Я уже изменяю столбец даты как индекс, используя

df.set_index ( "Дата", Inplace = True)

Тем не менее, я не знаю, как использовать функцию resample для моих целей ...

1 Ответ

0 голосов
/ 12 ноября 2018

Сначала убедитесь, что ваш фрейм данных имеет индекс типа DateTimeIndex.

Затем используйте функцию resample для увеличения (более высокой частоты) или уменьшения (более низкой частоты) вашего фрейма данных. Затем примените агрегатор (например, sum) для агрегирования значений по новой частоте дискретизации.

См. Документацию resample здесь: https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.resample.html

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...