Я новичок в Python, сталкиваюсь с трудностями при перемещении данных из исходного фрейма данных в целевой фрейм данных, например, инкрементные данные в пандах Python.
У меня есть две последние папки и полная, каждая имеет файл csv с той же схемой,последняя папка будет иметь новые строки или обновлять значения любой строки.
Мне нужно добавить эти новые строки и обновить значения в соответствии с последними строками в полном фрейме данных папки. Схема в последних и полных папках данных совпадает.
Например:
последние данные CSV-файла, как показано ниже
ID,FUNCTION,FULLNAME,FIRSTNAME,EMAIL_ADDRESS ---columns
1,SSSSKK,MK1,Brad1,abc ---1strow
1,SSSSKK,MK1,Brad1,ffff ---2ndrow
14,MM,MKSDHH1,HKD,GGG ---3rdrow
полные данные CSV-файла, как показано ниже
ID,FUNCTION,FULLNAME,FIRSTNAME,EMAIL_ADDRESS --coulmns
1,ZPVVLZ,MK1,Brad1,dfg --1strow
1,ZPVVLZ,MK1,Brad1,ffff --2ndrow
5,ZEVXZ4P0,Jamal,Clinton4,dfdf --3rdrow
12,,Mahammad,,gfdgsd --4throw
13,,ASFASDG,,dfgdfg --5throw
желаемый вывод в виде:
ID,FUNCTION,FULLNAME,FIRSTNAME,EMAIL_ADDRESS
1,SSSSKK,MK1,Brad1,abc
1,SSSSKK,MK1,Brad1,ffff
5,ZEVXZ4P0,Jamal,Clinton4,dfdf
12,,Mahammad,,gfdgsd
13,,ASFASDG,,dfgdfg
14,MM,MKSDHH1,HKD,GGG
Примечание. Должно быть только прямое обновление scd типа 1, столбцы могут иметь больше, но фиксированную схему в двух папках. Кто-нибудь может предложить, какой должен быть подход?
Я пробовал с режимами записи файлов, такими как w, w +, a, a +, но в состоянии добавлять строки новостей только обновления не происходят.