У меня большой массив данных в виде
timestamp | col1 | col2 ...
Я хочу выбрать строки с интервалом не менее x минут, где x может быть 5,10,30 и т. Д. Проблема заключается в том, что временные метки не разделены одинаково, поэтому я не могу сделать простой "взятие каждого nth ряд "трюк.
Пример:
timestamp | col1 | col2
'2019-01-15 17:52:29.955000', x, b
'2019-01-15 17:58:29.531000', x, b
'2019-01-16 03:21:48.255000', x, b
'2019-01-16 03:27:46.324000', x, b
'2019-01-16 03:33:09.984000', x, b
'2019-01-16 07:22:08.170000', x, b
'2019-01-16 07:28:27.406000', x, b
'2019-01-16 07:34:35.194000', x, b
если интервал = 10:
результат:
'2019-01-15 17:52:29.955000', x, b
'2019-01-16 03:21:48.255000', x, b
'2019-01-16 03:33:09.984000', x, b
'2019-01-16 07:22:08.170000', x, b
'2019-01-16 07:34:35.194000', x, b
если интервал = 30:
результат:
'2019-01-15 17:52:29.955000', x, b
'2019-01-16 03:21:48.255000', x, b
'2019-01-16 07:22:08.170000', x, b
Я мог бы использовать подход грубой силы n ^ 2, но я уверен, что есть способ панды для этого, которого мне не хватает ..
Спасибо! :)
РЕДАКТИРОВАТЬ: Это не дубликат Рассчитать разницу во времени между индексами Dandrame Dataframe просто для пояснения. Мне нужно установить подкадр данных на основе заданного интервала