У меня есть набор данных со средним интервалом в 22xx секунды между записями, в то время как средний интервал составляет 21 секунду.
Я пытался использовать DatetimeIndex.
floor / ceil / round функций (с частотой 20/21/22 секунды), но это приводит к дублированию индексов, и мне необходимо впоследствии объединить кадр данных с другим, поэтому дублированные индексы должны быть избегать. Удаление дублированных индексов также приводит к значительной потере данных.
Я хочу, чтобы в кадре данных использовался равноудаленный интервал времени, предпочтительно округленный до 00/20/40 секунд.
Несколько строк выборки данных показаны ниже.
2018-05-06 18:02:24 1.15e+07
2018-05-06 18:02:45 1.35e+07
2018-05-06 18:03:05 1.08e+07
...
2018-05-06 18:08:30 1.11e+07
2018-05-06 18:08:50 1.20e+07
2018-05-06 18:09:10 1.30e+07
...
Что при обработке должно возвращать следующее.
2018-05-06 18:02:20 1.15e+07
2018-05-06 18:02:40 1.35e+07
2018-05-06 18:03:00 1.08e+07
...
2018-05-06 18:08:20 1.11e+07
2018-05-06 18:08:40 1.20e+07
2018-05-06 18:09:00 1.30e+07
...
Округление приводит к дублированию индексов, в то время как floor
и ceil
также вызывают дублирование индексы.
Любые предложения о том, как настроить дрейф, не теряя слишком много данных?
Спасибо.