У меня есть два списка (A, B) файлов, которые были обработаны. Список A содержит все исходные файлы, список B содержит все файлы, которые были успешно обработаны (поэтому второй список (B) является подмножеством первого).
A содержит 231453 единиц.
B содержит 124769 наименований.
Я хочу вычесть их, чтобы увидеть, какие из этих файлов не получили процесс. (C должен содержать 106684 наименований)
Для этого я использую set :
newlist=[]
newlist2=[]
newlist3=[]
newlist=( set(A) - ( set(A) & set(B) ) )
newlist2=(set(A)^set(B))
newlist3=(set(A) - set(B))
print len(newlist)
print len(newlist2)
print len(newlist3)
Результаты:
134173
161662
134173
Почему предметов больше, чем ожидалось?