Я прочитал разные посты с похожим вопросом, но не смог найти именно этот вопрос. У меня есть два pandas DataFrames, которые я хочу объединить. У них есть метки времени в качестве индексов. 2-й кадр данных в основном перекрывает 1-й, и поэтому они оба совместно используют строки с одинаковыми временными метками и значениями.
Я хотел бы удалить эти строки, поскольку они совместно используют все: индекс и значения в столбцах. Если они не разделяют как индекс, так и значения в столбцах, я хочу сохранить их.
Пока что могу отметить:
Index.drop_duplicate: это не то, что я ищу за. Он не проверяет значения в столбцах одинаковы. И я хочу сохранить строки с одинаковыми временными отметками, но разными значениями в столбцах индексы, я хочу сохранить их.
Чтобы привести пример, я повторно использую данные, приведенные в ответе ниже.
df1
Value
2012-02-01 12:00:00 10
2012-02-01 12:30:00 10
2012-02-01 13:00:00 20
2012-02-01 13:30:00 30
df2
Value
2012-02-01 12:30:00 20
2012-02-01 13:00:00 20
2012-02-01 13:30:00 30
2012-02-02 14:00:00 10
Результат, который я хотел бы получить, следующий:
Value
2012-02-01 12:00:00 10 #(from df1)
2012-02-01 12:30:00 10 #(from df1)
2012-02-01 12:30:00 20 #(from df2 - same index than in df1, but different value)
2012-02-01 13:00:00 20 #(in df1 & df2, only one kept)
2012-02-01 13:30:00 30 #(in df1 & df2, only one kept)
2012-02-02 14:00:00 10 #(from df2)
Пожалуйста, есть идеи? Спасибо за вашу помощь! Bests