Я работаю с временным рядом непрерывных измерений концентрации озона в атмосферном воздухе в течение 4-месячного периода. Измерения проводятся каждые 5мин14 сек. Примерно 40000 точек данных.
Я начал обрабатывать свои данные в R, но столкнулся с некоторыми проблемами из-за недостатка навыков.
Мой data.frame - Дата в виде символов и концентрация озона в виде числовых значений.
Date O3_ppb
2018-05-26 17:55:58 UTC 33.95161
2018-05-26 18:01:12 UTC 35.12605
2018-05-26 18:06:28 UTC 36.03172
2018-05-26 18:11:42 UTC 36.81590
2018-05-26 18:16:57 UTC 37.11235
2018-05-26 18:22:12 UTC 37.26945
Я хочу проиллюстрировать ежедневную динамику концентрации озона в течение 24 часов на основе данных за один месяц. Это означает, что я хотел бы ежемесячно в среднем каждые 5 минут в течение 24 часов.
Я думал, что мне нужно как-то сортировать данные по группам каждые 5 минут в течение 24 часов. Например, 00:00:00, 00:05:00, 00:10:00…
Но так как в измерении есть дрейф, измерение, проведенное в 00:05:00 одного дня, будет проведено в 00:06:20 следующего, и так далее. А поскольку датчик время от времени перезагружается, число наблюдений каждый день тоже немного меняется.
Мой вопрос:
Есть ли функция или цикл, который мог бы сортировать мои данные с интервалами в 5 минут, которые также могли бы учитывать дрейф, так что измерения, которые, например, попадают между 00:02:30 - 00:07:30, будут отсортированы в группу под названием 00:05:00 и 00:07:30 - 00:12:30 в группу 00:10:00?
Извините, если это совершенно непонятно, но я новичок в R и в общем программировании. Я действительно надеюсь, что кто-то может мне помочь, поэтому я могу запустить проект