Я ищу эффективный способ выбрать совпадающие строки в 2 x кадрах данных на основе значения общей строки и вставить их в новый кадр данных, который я могу использовать для отображения различий между их пересечением в третий немного другой кадр данных, которыйсравнивает их.
**Example:**
DataFrame1
FirstName, City
Mark, London
Mary, Dallas
Abi, Madrid
Eve, Paris
Robin, New York
DataFrame2
FirstName, City
Mark, Berlin
Abi, Delhi
Eve, Paris
Mary, Dallas
Francis, Rome
В фреймах данных у меня есть потенциальное совпадение / перекрытие по «имени», поэтому пересечение по ним:
Mark, Mary, Abi, Eve
исключено из объединения:
Robin, Francis
Я создаю фрейм данных, который позволяет сравнивать значения из обоих:
DataFrameMatch
FirstName_1, FirstName_2, FirstName_Match, City_1, City_2, City_Match
И вставлять / обновлять (upsert), поэтому мой вывод:
DataFrameMatch
FirstName_1 FirstName_2 FirstName_Match City_1 City_2 City_Match
Mark Mark True London Berlin False
Abi Abi True Madrid Delhi False
Mary Mary True Dallas Dallas True
Eve Eve True Paris Paris True
Затем я могу сообщить о разнице между двумя списками и о том, какие конкретные поля отличаются.