Как объединить два pandas кадра данных, если совпадение ключа и идентификатора столбца не совпадают?
testchunck1.csv:
excel1 user_id public_key
0 Mark key1
1 Rhonda key2
2 Clara key3
3 Riley key4
testchunck2.csv:
excel2 user_id public_key
0 Ron key2
1 Russel key1
2 Dwyane key2
3 Abrax key4
output_df:
userid_left public_key userid_right
0 Mark key1 Russel
1 Rhonda key2 Ron
2 Rhonda key2 Dwyane
Примечание : key4
совпадает в обоих DF, но идентификатор (3) одинаков, поэтому его нет в выходных данных
Мой код:
test1Excel = pd.read_csv("testchunk.csv")
test2Excel = pd.read_csv("testchunk2.csv")
df = pd.merge(test1Excel,test2Excel, on='public_key', how='inner', suffixes = ('_left','_right')).dropna()
- Попытка использовать
.filter()
для фильтрации строк после объединения, но безуспешно. - Пробовал читать каждую строку Excel, чтобы проверить, совпадают ли идентификаторы, но это заняло много времени.
- Попытка передать условие в самом параметре on, но это не позволяет
Следовательно, переход к SO.