B "H
У меня есть транснациональные данные - то есть одна строка на транзакцию. Каждый из них имеет метку времени (DatetimeIndex). Однако они не на регулярной основе. Некоторые дни могут иметь тысячи транзакций, а некоторые - нет.
Так что, если я попытаюсь df.resample('D')
, я получу дни, в которых много образцов, и дни, в которых их нет (да!).
Мне нужно, чтобы в пустые дни была одна выборка каждая (или эквивалентное решение), чтобы статистические функции возвращали данные за эти дни. Лучшее значение для тех дней - последнее значение перед затишьем. то есть ffill
было бы идеально.
Возможно, вы порекомендуете позвонить ffill()
после того, как я вызову статистический метод. то есть resample('D').mean().ffill()
, что сработало бы, если бы у меня был только один расчет для групп. Однако просто подумайте. Что бы произошло, если бы я позвонил resample('D').ohlc().ffill()
? Тогда я получу максимумы и минимумы, перенесенные с предыдущих дней. Но на самом деле я должен получить close
с последнего действительного дня, перенося все четыре значения.
пс. Использование параметра fill_method
в resample
или вызов ffill
непосредственно для результатов resample('D')
приводит к ошибке
ValueError: невозможно переиндексировать неуникальный индекс с помощью метода или ограничения