У меня есть df:
df = pd.DataFrame([[1, np.nan, "filled", 3], [1, "filled", np.nan, 3], [1, "filled", np.nan, 4]], columns = ["a", "b", "c", "d"])
a b c d
0 1 NaN filled 3
1 1 filled NaN 3
2 1 filled NaN 4
И мой конечный результат должен быть:
df = pd.DataFrame([[1, "filled", "filled", 3], [1, "filled", np.nan, 4]], columns = ["a", "b", "c", "d"])
a b c d
0 1 filled filled 3
1 1 filled NaN 4
Поэтому я хочу объединить строки, которые идентичны во всех отношениях, кроме столбцаб и в.Проблема в том, что не всегда будет другая строка, идентичная, за исключением столбцов b и c.
Не могу придумать, как использовать df.groupby(["a", "d"]).apply()
, чтобы получить то, что я хочу.