Поиск дубликатов адресов гораздо сложнее, чем кажется, особенно если вам требуется точность. В этом случае недостаточно запроса MySQL ...
Я работаю на SmartyStreets , где мы занимаемся проверкой правильности и дедупликации и другими вещами, и я видел множество разнообразных проблем с похожими проблемами.
Существует несколько сторонних сервисов, которые помечают дубликаты в списке для вас. Выполнение этого только с подзапросом MySQL не будет учитывать различия в форматах и стандартах адресов. У USPS (для адреса в США) есть определенные руководящие принципы, чтобы сделать эти стандарты, но только небольшая часть поставщиков сертифицирована для выполнения таких операций.
Итак, я бы порекомендовал вам лучший ответ - экспортировать таблицу, например, в CSV-файл и отправить ее в работающий обработчик списков. Один из них - LiveAddress , который автоматически сделает это за вас от нескольких секунд до нескольких минут. Он будет отмечать повторяющиеся строки с новым полем с именем «Duplicate» и значением Y
.