Upsert целевого dataframe из исходного dataframe в python - PullRequest
0 голосов
/ 02 октября 2019

Я новичок в Python, сталкиваюсь с трудностями при перемещении данных из исходного фрейма данных в целевой фрейм данных, например, инкрементные данные в пандах Python.

У меня есть две последние папки и полная, каждая имеет файл csv с той же схемой,последняя папка будет иметь новые строки или обновлять значения любой строки.

Мне нужно добавить эти новые строки и обновить значения в соответствии с последними строками в полном фрейме данных папки. Схема в последних и полных папках данных совпадает.

Например:

последние данные CSV-файла, как показано ниже

ID,FUNCTION,FULLNAME,FIRSTNAME,EMAIL_ADDRESS   ---columns
1,SSSSKK,MK1,Brad1,abc   ---1strow
1,SSSSKK,MK1,Brad1,ffff    ---2ndrow
14,MM,MKSDHH1,HKD,GGG    ---3rdrow

полные данные CSV-файла, как показано ниже

ID,FUNCTION,FULLNAME,FIRSTNAME,EMAIL_ADDRESS  --coulmns
1,ZPVVLZ,MK1,Brad1,dfg     --1strow
1,ZPVVLZ,MK1,Brad1,ffff    --2ndrow
5,ZEVXZ4P0,Jamal,Clinton4,dfdf  --3rdrow
12,,Mahammad,,gfdgsd   --4throw
13,,ASFASDG,,dfgdfg  --5throw

желаемый вывод в виде:

ID,FUNCTION,FULLNAME,FIRSTNAME,EMAIL_ADDRESS
1,SSSSKK,MK1,Brad1,abc
1,SSSSKK,MK1,Brad1,ffff
5,ZEVXZ4P0,Jamal,Clinton4,dfdf
12,,Mahammad,,gfdgsd
13,,ASFASDG,,dfgdfg
14,MM,MKSDHH1,HKD,GGG

Примечание. Должно быть только прямое обновление scd типа 1, столбцы могут иметь больше, но фиксированную схему в двух папках. Кто-нибудь может предложить, какой должен быть подход?

Я пробовал с режимами записи файлов, такими как w, w +, a, a +, но в состоянии добавлять строки новостей только обновления не происходят.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...