Извините, если этот вопрос был задан ранее или является тривиальным, но я не смог найти ответ здесь. Кроме того, я довольно новичок в Python.
Что я хочу сделать, так это взять один фрейм данных и «добавить» другие фреймы данных с одинаковыми столбцами на основе некоторого ключевого столбца. Эти ключи не являются уникальными и появляются несколько раз. Может случиться так, что ключ не появится в кадре данных, который нужно добавить, тогда он должен добавить «nan», но only в этой строке.
Итак, этот фрейм данных
df1 = pd.DataFrame({"X": [1,2,3,4], "KEY":['A','A','B','C']})
должен быть объединен с этим
df2 = pd.DataFrame({"X": [6,7,8,9], "KEY":['A','A','B','B']})
и я хочу такой результат
df_merged = pd.DataFrame({"X_1": [1,2,3,4], "KEY":['A','A','B','C'], "X_2": [6,7,8,'nan']})
Поэтому, если значение ключевого столбца появляется в той же строке в добавляемом кадре данных, я хочу, чтобы все остальные столбцы в этой строке также были, если не только nans. Я пробовал несколько форм объединений и слияний, но я просто не могу понять это. Помощь будет принята с благодарностью!