При использовании Pandas resample () для понижающей выборки, как я могу использовать fill_method или fill_na () или ffill ()? - PullRequest
0 голосов
/ 08 января 2019

B "H

У меня есть транснациональные данные - то есть одна строка на транзакцию. Каждый из них имеет метку времени (DatetimeIndex). Однако они не на регулярной основе. Некоторые дни могут иметь тысячи транзакций, а некоторые - нет.

Так что, если я попытаюсь df.resample('D'), я получу дни, в которых много образцов, и дни, в которых их нет (да!).

Мне нужно, чтобы в пустые дни была одна выборка каждая (или эквивалентное решение), чтобы статистические функции возвращали данные за эти дни. Лучшее значение для тех дней - последнее значение перед затишьем. то есть ffill было бы идеально.

Возможно, вы порекомендуете позвонить ffill() после того, как я вызову статистический метод. то есть resample('D').mean().ffill(), что сработало бы, если бы у меня был только один расчет для групп. Однако просто подумайте. Что бы произошло, если бы я позвонил resample('D').ohlc().ffill()? Тогда я получу максимумы и минимумы, перенесенные с предыдущих дней. Но на самом деле я должен получить close с последнего действительного дня, перенося все четыре значения.

пс. Использование параметра fill_method в resample или вызов ffill непосредственно для результатов resample('D') приводит к ошибке

ValueError: невозможно переиндексировать неуникальный индекс с помощью метода или ограничения

...