Я недавно начал работать с Pandas (новичок в Python). Я пытаюсь объединить две записи из разных идентификаторов и создать окончательную запись, которая содержит значения для каждого столбца из идентификаторов, которым я доверяю для каждого столбца.
df1:
ID NAME ADDRESS PHONE
1 abc street1 9999
df2:
ID NAME ADDRESS PHONE
2 xyz street2 8888
df_col_priority:
COLUMN PRIORITY_BY_ID
NAME 1
ADDRESS 2
PHONE 2
Итак, здесь, основываясь на приоритете каждого столбца для каждого идентификатора, я должен получить одну выходную запись как:
df_output:
NAME ADDRESS PHONE
abc street2 8888
Так что в основном я должен получить NAME из ID = 1 и 2 других поля из ID = 2.
Кроме того, у меня есть тысячи записей, для которых я выберу пару из двух записей по логике и вычислю окончательную выходную запись, используя вышеуказанный метод.
Я не могу придумать способ достижения этого, кроме циклического перебора каждого столбца для каждого кадра данных, извлечения приоритета и создания новой записи столбец за столбцом за конкатом. Но я думаю, что это довольно неэффективно. Любая помощь будет оценена.