Я пытаюсь найти разницу между двумя CSV-файлами по ячейкам. Ниже приведен код, который я использовал, однако он использует set
s и обрабатывает невозможность обнаружить разницу, если есть две строки с одинаковым точным значением. Например:
Первый csv:
bob virgnia 22
bob virgnia 22
adam virginia 21
jack california 22
Второй csv:
bob virgnia 22
adam virgnia 21
jack california 22
Вывод без разницы.
# Read in the original and new file
orig = open('T1.csv','r')
new = open('T2.csv','r')
#in new but not in orig
bigb = set(new) - set(orig)
# small = set(orig) - set(new)
# To see results in console if desired
print(bigb)
print()
# Write to output file
with open('different.csv', 'w') as file_out:
for line in bigb:
file_out.write(line)
#close the files
orig.close()
new.close()
file_out.close()