У меня есть два набора данных в Excel. Набор данных_1 содержит список акций в индексе для диапазона дат. Набор данных_2 содержит финансовые показатели для каждой акции на тот же диапазон дат.
df_1 = pd.read_excel(Dataset_1.xlsx)
df_1
выглядит следующим образом:
1980-01-31 00:00:00 1980-02-29 00:00:00
0 a0 b0
1 a1 b1
2 a2 b2
и
df_2 = pd.read_excel(Dataset_2.xlsx)
дает следующее
1980-01-31 00:00:00 1980-02-29 00:00:00
a0 100 200
a1 200 300
a2 300 400
b0 400 500
b1 500 600
b2 600 700
Я хочу применить значения из набора данных_2 для соответствующего запаса / даты в наборе данных_1, а затем выполнить различные анализы для каждого месяца данных (рейтинг, сортировка, верхняя 10, нижняя 10 и т. Д. c et c)
Я очень плохо знаком с Python ... мои вопросы:
(1) У меня есть степень контроля над тем, как эти входы структурированы ... моя жизнь станет проще, если я изменю порядок расположения базовых наборов данных? Или легче манипулировать этим в Python? Я бы предпочел go через боль, чтобы научиться делать это в Python, если это не очень плохая идея
(2) Правильно ли я считаю, что мне нужно транспонировать оба кадра данных так, что у меня есть даты в столбце, которые я установил в качестве индекса?
(3) Исходя из того, что (2) правильно, я пытался использовать функцию pivot (), но я не могу понять, как установить индекс в качестве заголовков столбцов
. Любое руководство будет чрезвычайно оценено. Заранее спасибо