У меня есть 2 кадра данных. У df1 39780 строк, а у df2 8900454 строк
Столбцы df1, которые я хочу объединить:
['postalcode','housenumber', 'suffix']
Столбец суффикса содержит некоторые номера NAN.
столбцы df2:
['postalcode_right','housenumber_right', 'suffix_right', 'index_right']
(столбец с именем 'index_right' не является индексом этого фрейма данных.)
df2 = pd.merge(df1, df2, how='left', left_on=['postalcode','housenumber', 'suffix'], right_on = ['postalcode_right','housenumber_right', 'suffix_right'])
Поскольку df1.suffix содержит NAN, некоторые строки справа соответствуют нескольким строкам слева.
Как я могу предотвратить это ИЛИ очистить значения index_right для строк, которые совпадают несколько раз?