У меня есть два фрейма данных с разными номерами строк и столбцов. Обе таблицы имеют несколько общих столбцов, включая «Идентификатор клиента». Обе таблицы выглядят следующим образом: 11697 строк × 15 столбцов и 385839 строк × 6 столбцов соответственно. Идентификатор клиента может повторяться во второй таблице. Я хочу объединить обе таблицы и объединить похожие столбцы, используя идентификатор клиента. Как я могу сделать это с Python PANDAS.
Одна таблица выглядит так -

а другой выглядит так -

Я использую код ниже -
pd.concat([df1, df2], sort=False)
Просто хотел убедиться, что я не теряю никакой информации? Как я могу проверить, есть ли несколько записей с одним идентификатором и как я могу объединить его в один результат?
РЕДАКТИРОВАТЬ -
Когда я использую приведенный выше код, здесь до и после значений NA'S в наборе данных -

Может кто-нибудь сказать, где я ошибся?