У меня есть 2 DataFrames, и я должен объединить оба и создать новый DataFrame с уникальными и последними строками, например,
DataFrame 1:
+------+-------+---------+-----+-------+
|col A |col B |col C |col D|col E |
+------+-------+---------+-----+-------+
|city |prod 1 |9/29/2017|358 |193 |
|city |prod 2 |8/25/2017|50 |201 |
|city |prod 3 |9/9/2017 |236 |169 |
|city |prod 4 |9/28/2017|358 |193 |
|city |prod 5 |8/24/2017|50 |201 |
|city |prod 6 |9/8/2017 |236 |169 |
+------+-------+---------+-----+-------+
DataFrame 2:
+------+-------+---------+-----+-------+
|col A |col B |col C |col D|col E |
+------+-------+---------+-----+-------+
|city |prod 1 |9/29/2018|359 |197 |
|city |prod 2 |8/25/2018|51 |209 |
|city |prod 3 |9/9/2018 |237 |181 |
|city |prod 7 |9/28/2017|358 |193 |
|city |prod 8 |8/24/2017|50 |201 |
|city |prod 9 |9/8/2017 |236 |169 |
+------+-------+---------+-----+-------+
Мне нужно объединить 2 DataFrames от col A и col B, и результирующий DataFrame должен выглядеть следующим образом.
Обратите внимание, что prod 1, 2 и 3 присутствует в обоих DataFrame, но взят из DataFrame 2, поскольку он имеет самую последнюю дату (столбец C)
DataFrame 3:
+------+-------+---------+-----+-------+
|col A |col B |col C |col D|col E |
+------+-------+---------+-----+-------+
|city |prod 1 |9/29/2018|359 |197 |
|city |prod 2 |8/25/2018|51 |209 |
|city |prod 3 |9/9/2018 |237 |181 |
|city |prod 4 |9/28/2017|358 |193 |
|city |prod 5 |8/24/2017|50 |201 |
|city |prod 6 |9/8/2017 |236 |169 |
|city |prod 7 |9/28/2017|358 |193 |
|city |prod 8 |8/24/2017|50 |201 |
|city |prod 9 |9/8/2017 |236 |169 |
+------+-------+---------+-----+-------+
Пожалуйста, дайте мне знать, как я могу этого достичь.