У меня есть приложение, которое найдет дубликаты из записей таблицы с информацией для выставления счетов. Каждый процесс содержит около 50 тыс. Записей.
Представление таблицы и результата
In the above picture, highlighted are the result cols and here what I did is ,
Amount Paid Dup == Duplicate count of col 'Amount Paid',
AmountBilled Dup == Duplicate count of col 'AmountBilled',
Invoice Number WO Alpha Dup == Duplicate count of col value 'Invoice Number' without alpha,
Bill Number Dup == Duplicate count of col 'Bill Number',
Invoice and Bill Number Dup == Combined Duplicate count of col 'Invoice number and Bill Number'.
Как и выше, мне нужно проверить дубликаты по 6 столбцов, и я использовал операторы merge в и with, но это заняло слишком много времени для обработки документа. Пожалуйста, предложите лучший метод для обработки подобной проверки дубликатов