Управление временными рядами с разными датами начала - PullRequest
0 голосов
/ 25 сентября 2019

Я начинающий программист на Python, и у меня есть проблема, с которой я надеялся, что вы мне поможете.

У меня есть два временных ряда в Пандах, но они начинаются в разные даты.Допустим, один начинается в 1989 году, а другой - в 2002 году. Теперь я хочу сравнить совокупный рост этих двух показателей путем индексации обеих серий к 2002 году (первый период времени, когда у меня есть данные для обоих) и рассчитать соотношение.

Как лучше всего это сделать?В идеале сценарий должен проверять, какие самые ранние из имеющихся данных для пары рядов, и с этого момента индексировать их до 100.

Заранее спасибо!

1 Ответ

0 голосов
/ 25 сентября 2019

Практическим решением может быть разделение информационного блока на два столбца, по одному для каждого временного ряда, и добавление столбца «месячный год» к каждому информационному кадру, в котором указаны только месяц и год (например, 05-2015).Затем вы можете использовать pd.merge на обоих фреймах данных для этой переменной месяца, сохраняя только те строки, у которых есть перекрывающиеся месяцы, в которых они происходят.Функция будет иметь вид pd.merge(df1, df2, on='monthyear', how='inner')

. Вы можете разделить информационный кадр pandas, создав новый информационный кадр и загрузив его только в 1 столбец (или строку, в зависимости от того, как выглядит ваш информационный кадр).df1 = pd.Dataframe(original_dataframe[0]) и df2 = pd.Dataframe(original_dataframe[1])

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...