Я бы начал с переформатирования данных, где каждая строка имеет вид:
Timestamp Temperature Humidity
2018-05-01 09:00:00 40.1 80
2018-05-01 09:05:00 40.2 80
2018-05-01 09:10:00 40 82
2018-05-01 09:15:00 41 81
2018-05-01 09:20:00 40.8 81
2018-05-01 09:25:00 40.2 84
Это уменьшит размер ваших данных в два раза и уменьшит объем используемого вами пространства хранения.Вы можете использовать функцию 'преобразование значений в столбцы' в Dataprep.Это создаст столбец для температуры и один для влажности.
В этом формате вы можете использовать оконную функцию ROLLINGAVERAGE для вычисления средних значений.Сделайте так, чтобы функция вычисляла среднее значение для двух предшествующих ей строк, установив следующие параметры:
rollingaverage(Temperature, 2, 0)
Первый аргумент - это имя столбца, второй - предыдущие строки, а последний - числоиз следующих строк, по которым вычисляется среднее.Повторите вышеуказанную функцию для столбца Влажность.Результаты должны выглядеть примерно так:
Далее, под опцией фильтра строк, используйте функцию «строки через равные интервалы» , чтобы сохранить каждую третью строкуначиная с третьей записи.Установите этот параметр следующим образом:
Удалите две исходные строки температуры и влажности, и вы получите следующее:
Timestamp Temperature Humidity
2018-05-01 09:10:00 40.1 80.67
2018-05-01 09:25:00 41 82