Таким образом, способ получить информацию о дубликатах в кадре данных pandas - использовать функцию groupby. Вы можете сгруппировать свой фрейм данных по почтовому индексу и подсчитать количество вхождений и одновременно суммировать поле количества.
В приведенном ниже коде я создал простой кадр данных из 10 почтовых индексов с соответствующим количеством. Некоторые почтовые индексы дублируются. Затем код выполняет группировку, фильтрует дублированные почтовые индексы и выводит два списка, которые, я думаю, вам нужны.
import pandas as pd
## create sample dataframe
df = pd.DataFrame({'Zip':['11111','00000','00001','11001','00000','11100','11111','00110','11011','00010'],
'Quantity':[3,6,2,6,5,8,9,0,1,4]
})
## group dataframe by Zip, count the number of occurrences and sum the Quantity field
grouped_df = df.groupby('Zip')['Quantity'].agg(['sum','count']).reset_index()
## output the duplicated zipcodes as a dataframe with the number of occurrences and sum of quantity
duplicated_df = grouped_df[grouped_df['count']>1]
duplicated_df.columns = ['DuplicateZip','SumOfQuantity','NumOfOccurrences']
## output the duplicated zipcodes as a list
duplicated_zipcodes_list = list(grouped_df[grouped_df['count']>1]['Zip'])
## output the sum of quantities for duplicated zipcodes as a list
duplicated_zipcodes_quantitysum_list = list(grouped_df[grouped_df['count']>1]['sum'])