максимальная разница между двумя временными рядами разного разрешения - PullRequest
0 голосов
/ 12 марта 2020

У меня есть два временных ряда данных, которые показывают потребность в электроэнергии в разрешении в один час и разрешении в пять минут. Я пытаюсь найти максимальную разницу между этими двумя временными рядами. Таким образом, данные с часовым разрешением имеют 8760 строк (ежечасно за год), а данные с 5-минутным разрешением имеют 104 722 строки (5 минут за год).

Я могу думать только о методе, который будет Расширьте почасовые данные до 5-минутного разрешения, которое будет иметь 12-кратное повторение почасовых данных, и найдите максимум разницы двух наборов данных.

Если этот метод является способом к go, есть ли простой способ конвертировать мои почасовые данные в 5-минутное разрешение, повторяя почасовые данные 12 раз?

для вашей справки Я разместил график этих данных за один день.

PS> I Я использую Python для выполнения этой задачи enter image description here

Ответы [ 2 ]

0 голосов
/ 12 марта 2020

Я настоятельно рекомендую не преобразовывать почасовые данные в пятиминутные. Если данные в обоих случаях относятся к средней загрузке этих временных диапазонов, вы будете смотреть на более точные данные, если сгруппировать пятиминутные интервалы в почасовые наборы данных. Вы получите больше детализации, как вы говорите, но гранулярность не основана на точных данных, поэтому вы на самом деле не получаете больше пользы от них. Если вы объединяете пятиминутные порции в почасовые порции и сравниваете таким образом серии, вы можете быть более уверены в достоверности своих результатов.

Чтобы сгруппировать их вместе, чтобы получить этот результат, вы можете определить используйте следующую функцию и используйте метод apply следующим образом:

def to_hour(date):
    date = date.strftime("%Y-%m-%d %H:00:00")
    date = dt.strptime(date, "%Y-%m-%d %H:%M:%S")
    return date

df['Aggregated_Datetime'] = df['Original_Datetime'].apply(lambda x: to_hour(x))
df.groupby('Aggregated_Datetime').agg('Real-Time Lo
0 голосов
/ 12 марта 2020

Numpy функция .repeat ()

Вы можете изменить свои почасовые данные на 5-минутные данные, используя функцию повтора numpy

import numpy as np

np.repeat(hourly_data, 12)
...