У меня есть два pandas фрейма данных df1
и df2
с другим мультииндексом. Я хотел бы выровнять оба фрейма данных в соответствии с последним уровнем индекса. Правила более коротких фреймов данных, то есть все даты, которых нет в более коротком фрейме данных, должны быть удалены из более длинного фрейма данных.
Если бы мне пришлось отбросить первые два уровня индекса, я получил бы результат, который искал. Однако я бы хотел сохранить полный мультииндекс.
import numpy as np
import pandas as pd
idx1_l1 = np.tile("provider_1", 31)
idx2_l1 = np.tile("provider_2", 22)
idx1_l2 = np.tile("indicator_1", 31)
idx2_l2 = np.tile("indicator_2", 22)
idx1_l3 = pd.date_range(start="2020-01-01", end="2020-01-31")
idx2_l3 = pd.date_range(start="2020-01-10", end="2020-01-31")
data1 = np.random.randint(low=1, high=100, size=31)
data2 = np.random.randint(low=1, high=100, size=22)
df1 = pd.DataFrame(data=data1, index=[idx1_l1, idx1_l2, idx1_l3])
df2 = pd.DataFrame(data=data2, index=[idx2_l1, idx2_l2, idx2_l3])
df1, df2 = df1.droplevel([0, 1]).align(df2.droplevel([0, 1]), join="inner", axis=0)